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Avant-Propos 

Cet ouvrage de Statistique Descriptive s'adresse aux 
étudiants de la première année universitaire, premier et deuxième 
semestres de toutes les filières de la nouvelle génération des 
Licences Fondamentales en sciences, sciences économiques et 
gestion... ainsi qu'aux étudiants de la première année des écoles 
d'ingénieurs et des écoles supérieures de commerce et gestion. 

C'est un support de cours et des exercices, présentant les 
notions de base de la Statistique. Il dispense, donc, les étudiants de 
prendre des notes de cours, néanmoins, il les invite à faire un bon 
nombre d'exercices, extraits des contrôles et des examens, 
présentés à la fin de chaque chapitre. 

M. El Merouani 
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Statistique Descriptive Introduction à la Statistique 

Chapitre : 



Introduction à la Statistique 



L-Origine et définitions: 

Le terme STATISTIQUE provient du mot latin STATUS due 
aux premières activités relatives à l'Etat telles que les 
recensements de la population, la collecte et la quantification de 
l'information,... etc. De-là provient l'utilisation du terme 
STATISTIQUE (ou STATISTIQUES au pluriel) pour se référer à 
une quantité d'information numérique collectée auprès de 
plusieurs situations telles que les accidents de la circulation, les 
indices de la bourse, les indices des prix, le Chômage, les votes 
aux élections,... etc. que nous sommes habitués de lire ou 
d'entendre dans les moyens de communication. 

Nous donnons, ci-dessous, deux manières de définir la 
Statistique ou les Sciences Statistiques que nous considérons les 
plus générales et en même temps qui incluent les composantes 
basiques de la plupart des théories Statistiques : 

V. Barnett (1973), «Comparative Statistical Inference», 
John Wiley & Sons : (( La Statistique se définie comme l'étude et la 

7 «ETlfcUP 

.corn 



Statistique Descriptive Introduction à la Statistique 

recherche de l'information qui doit être utilisée dans l'orientation 
pour prendre une action dans une situation pratique qui comporte 
une incertitude)). 

M. De Groot (1970), «Optimal Statistical Décision», 
McGraw Hili : (( Les Sciences Statistiques s'occupent du 
développement des théories et techniques appropriés pour faire 
des inférences sous les conditions d'incertitude et d'ignorance 
partielle qui existent nécessairement dans un large champ 
d'activités)). 

Les deux définitions antérieures comprennent plusieurs termes 
que nécessitent une description et un commentaire plus détaillés, 
mais, nous, dans ce cours d'initiation, nous les surpassons pour 
développer l'aspect pratique de la Statistique. 

IL-Termes usuels de la statistique : 
l.-Population : 

L'ensemble étudié par la statistique s'appelle Population. C'est 
l'ensemble statistique de référence sur lequel seront effectuées des 
applications quantitatives. On la note Q. 
Exemples : 

■ Ensemble des entreprises d'un secteur, 

■ Pièces produites par une usine, 

■ Ventes réalisées par un réseau de détaillants, etc. 
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2.- Individu: 

C'est la partie élémentaire d'une population (définie selon les 

besoins de l'étude). On le note CC. 
Exemples : 

■ Une entreprise/ 

■ Une pièce produite, 

■ La vente d'un détaillant. 

3.- Caractère: 
C'est la caractéristique qui sert à décrire un individu d'une 
population. C'est donc une propriété commune des individus 
selon laquelle on va mener l'étude statistique. On le note X . Le 
caractère peut être quantitatif, mesurable ou qualitatif non 
mesurable. Dans le cas quantitatif, le caractère X s'appelle une 
variable statistique ou il est mesurable par une variable statistique. 
Alors, cette variable X peut être continue (XeIR ou à des 
intervalles de IR ) ou discontinue c'est-à-dire discrète (XgIN ). 
Exemples: 

Chiffre d'affaires, valeur ajoutée, effectif des employés.,, sont des 
caractères quantitatifs appliqués à une entreprise. 
Image de marque, climat social, solidité financière sont des 
exemples de caractères qualitatifs, non mesurables directement 
par une variable. , 
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Statistique Descriptive Introduction à la Statistique 

4.- Modalités : 

Ce sont les différentes situations ou formes que peuvent prendre les 
individus selon le caractère étudié. On les note .Y, . Les différentes 
modalités doivent être à la fois incompatibles, c'est-à-dire que chaque 
individu a une et une seule modalité, et exhaustives, c'est-à-dire les 
modalités englobent toute la population. 
Exemples : 

Les formes que peut prendre un caractère : 

• bon ou mauvais pour une pièce contrôlée. 

• les classes de chiffres d'affaires définies par le banquier pour 
estimer le niveau de risque. 

• les classifications du personnel employé. 

• etc. 

5.- Effectifs ou fréquences absolues : 

L'effectif est le nombre d'individus présentant chaque 
modalité ou le nombre de fois qu'une modalité est observée, on 
l'appelle aussi la fréquence absolue. On le note "ni". 
Exemple : 

Les étudiants de la 1*" année éco. & gestion sont étudiés 
selon le nombre de leurs frères et sœurs. Alors on a ; 

• population : l'ensemble des étudiants de la 1 èr8 année éco. & 
gestion. 

• individus : étudiants. 

• caractère : nombre des frères et sœurs (quantitatif et discret). 

• modalités : 0, 1,2,3,4, 5,... 
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. effectifs : 10, 20, 30, 40, 25,12,. .. 
6.- Effectif total ; 
L'effectif total est la somme des effectifs ; on le note N et on a : 




( k étant le nombre des modalités). 

7.- Fréquence relative: 

La fréquence relative (ou fréquence tout court) est la 
proportion d'individus ayant la même modalité dans la 

population étudiée, on la note f, . C'est le rapport entre l'effectif 



de la modalité et l'effectif total : 




(fc étant le 



nombre des modalités). 
Remarques: 

■ Lorsqu'on multiplie une fréquence relative par 100, on obtient 

le pourcentage de la modalité A, dans le total de la population. 

■ La somme des fréquences relatives est égale à 1 . En effet ; 



2* 



N 



= K = l 

/Y 



i-i 
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Statistique Descriptive Représentation des données 

Chapitre 1 : 



Représentation des données 



L-Introduction : 

Dans leur état brut 'es informations ne peuvent être 
utilisées, d'où la nécessité de les "mettre en ordre", c'est-à-dire de 
les ranger. 

A ce stade, elles forment une distribution ou une série 
statistique représentant un ensemble des modalités et des effectifs 
d'un caractère. 
IL-Tableaux statistiques : 

Le tableau correspondant aux séries à un seul caractère est à 
simple entrée, dans lequel figurent deux colonnes: l'une pour les 
modalités prise par la variables (x.) et l'autre pour les effectifs 
correspondantes (n,). 

La présentation d'un tableau statistique fait correspondre à 
chaque modalité xi un "effectif ou "fréquence absolue" ni. 
1." Cas des caractères qualitatifs : 

Dans ce cas, les caractères ne sont pas mesurables, on peut 
donc les ranger dans un tableau statistique Selon une logique qui 
permet au mieux l'interprétation. 
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Exemple : 

Distribution des employés d'une multinationale selon leur 

nationalité : 



Nationalité (xi) 


Effectifs (m) 


Marocains 


1450 


Français 


120 


Tunisiens 


50 


Espagnoles 


28 


Autres 


7 




N = 1655 



2.- Cas des caractères quantitatifs : 

Lorsque le caractère est quantitatif, il faut distinguer le cas 
des variables discrètes du cas des variables continues. 

a.- Variables statistiques discrètes : 

Dans ce cas, les valeurs \i sont discrètes et correspondent 
chacune à un effectif ni , 

Exemple : 

Soit la distribution statistique représentant le nombre des 

frères et sœurs des étudiants de la 1*" à\v\êe éCO. & gestion : 
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Frères et soeurs (x-,) 





1 
2 
3 
4 
5 
6 
7 
8 
9 
10 



Effectifs (m) 



10 

20 

30 

40 

25 

12 

10 

8 

4 

2 

1 



N = 162 



b.- Variabl es statistiques continues: 

Dans ce cas, les valeurs prises par la variable ne sont pas 
entières, ce qui nécessite la création de classes de valeurs possibles 
définies par les extrémités déclasses (ou bornes). 



Exemple : 

Soit la distribution statistique des employés d'une entreprise selon 
leurs salaires mensuels en dirhams : 
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Représentation des données 



Salaires en DH (xi) 


Effectifs (m) 


< 2500 


2 


[2500,3500[ 


4 


[350O,450O[ 


11 


[4500.5500[ 


5 


>5500 


3 




N= 25 



Remarque : 

■ La division de la série en classes se fait selon la nature du sujet 
traité, elle relève donc du statisticien et de son appréciation du 
problème : 

— « Si l'intervalle est petit, le nombre de classes sera 
important et peut rendre les calculs plus compliqués. 
— Si l'intervalle est grand, l'information se perd à cause 
de la condensation des chiffres. 

■ Dans le cas des variables statistiques continues, les modalités xi 
appartiennent à des intervalles de la forme [e,-i, ei [que l'on 
appelle des classes et qui ont un centre : 



tf^u^r -> 




,./ç 
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— Ces intervalles ou classes ont une largeur ou 
amplitude : 



a i = e , -e w 



Exemple : 

Dans l'exemple précédent, les centres et amplitudes de classes 
sont : 



[ei-i, ei[ 


ni 


• 

Cl 


ai 


fi 


% 


<2500 


? 

ml 


— 


— 


0,08 


8% 


[250O,35O0[ 


4 


3000 


1000 


0,16 


16% 


[3500.4500[ 


11 


4000 


1000 


0,44 


44% 


[450O,55OO[ 


5 


5000 


1000 


0,2 


20% 


>5500 


3 


— 


— 


0,12 


12% 




N = 






Z/;=i 


100% 




25 











■ On a complété le tableau, en y ajoutant les fréquences relatives, 
calculées comme on a vu, en utilisant la formule : 




■ On a aussi calculé les pourcentages : à chaque fois, on a 
multiplié par 100 les fréquences relatives. 
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Statistique Descriptive Représentation des données 

III.-Effectifs cumulés et fréquences cumulées ; 

1.' Effectifs cumulés croissants : 

L'effectif cumulé croissant est le nombre de fois qui se 
présente une modalité ou plusieurs inférieures à une valeur 
donnée. On le note nief ou nicc. Il se calcule en totalisant les 
effectifs avec ceux des classes suivantes. Il sert à répondre aux 
questions qui demandent un nombre ou un effectif « moins de » 
ou « inférieur à » une valeur donnée. 
2.- Effectifs cumulés décroissants : 

L'effectif cumulé décroissant est le nombre de fois qui se 
présente une modalité ou plusieurs supérieures à une valeur 
donnée. On le note nici ou nied. Il se calcule en totalisant les 
effectifs avec ceux des classes antérieures. Il sert à répondre aux 
questions qui demandent un nombre ou un effectif « plus de » ou 
« supérieur à » une valeur donnée. 
3.- Fréquences cumulées croissantes : 

Une fréquence cumulée croissante est la proportion des 
modalités « inférieur à » ou « moins de » une valeur donnée. On la 
note ficî ou ficc. Elle se calcule en totalisant les fréquences 
relatives avec celles des classes suivantes, ou en calculant le 
rapport de l'effectif cumulé croissant et l'effectif total : 
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§e Fréquences cumulées décroissantes : 

Une fréquence cumulée décroissante est la proportion des 
modalités « supérieur à » ou « plus de » une valeur donnée. On la 
note fic| ou ficd. Elle se calcule en totalisant les fréquences 
relatives avec celles des classes antérieures, ou en calculant le 
rapport de l'effectif cumulé décroissant et l'effectif total : 

Exemple : 

Pour l'exemple précédent, calculons les effectifs cumulés et les 
fréquences cumulées : 



[en, ei[ 


ni 


fi 


nicj 


ficî 


nic| 


fie] 


<2500 


9 

mm 


0,08 


2 


0,08 


25 


1 


[2500, 3500[ 


4 


0.16 


6 


0,24 


23 


0,92 


[35O0.4500[ 


11 


0,44 


17 


0,68 


19 


0,76 


[4500,5500[ 


5 


0,2 


22 


0.88 


8 


0, 32* 


>5500 


3 


0,12 


25 


1 


3 


0,12 




N = 


Z/=i 












25 













On peut donc dire d'après ces calculs que, par exemple, 68% des 
salariés gagnent moins de 4500 DH/mois.et 32% des employés 

ont un salaire supérieur à 4500 DH/mois. 
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Dans l'entreprise de cet exemple qui a un total de 25 employés, 
1 7 parmi eux gagnent moins de 4500 DH/mois et 8 ont un 

salaire supérieur à 4500 DH/mois. 

5.- Fonction de répartition : 

Étant donnée une série statistique correspondante à la variable 

statistique X, 

la fonction de répartition F(x) est définie par : 

Flx) = J]cc 

avec fgccest la fréquence cumulée croissante : 

et jr M < x < \) si X est discrète ou qualitative 
ou e t _ v < x < e. si X est continue. 

Donc P(x) = y\fi si X est discrète ou qualitative 



\<x. 



et F(x)-« jLfj si X est continue. 

IV .-Représentations graphiques : 

On a vu que Ton représente les séries statistiques par des 
tableaux, mais ces tableaux restent parfois insuffisants pour voir, 
par exemple, si une variable croit, décroît ou reste constante ; ou si 
elle présente autres caractéristiques. Les représentations 
graphiques peuvent nous donner une vue immédiate et complète 
des phénomènes étudiés. 
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Représentation des données 



Les représentations graphiques diffèrent selon la nature des 
variables étudiées. 

1.- Caractères quantitatifs : 

Dans ce cas, il faut faire la distinction entre les variables 
statistiques continues et discrètes. 

a.- Variables statistiques discrètes : 
*- Le diagramme en bâtons : 

Le diagramme en bâtons représente les fréquences fi ou les 
effectifs m correspondants à chaque valeur de 3a variable Xi 

Exemple : 

Soit la série statistique donnant le nombre des frères et 
sœurs des 30 étudiants de la l*' ru année éco. & gestion : 



Xi 


ni 


fi 





2 


0,067 


1 


3 


0,1 


2 


5 


0,167 


3 


10 


0,333 


4 


7 


0,234 


5 


2 


0,067 


6 


1 


0,033 




N=30 


1 



20 
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Représentation des données 



o.m 



0.241 




12 3 4 5 6 

Diagramme en bâtons des fréquences relatives 
*-La courbe cumulative : 

La courbe cumulative est une fonction de distribution qui 
représente les effectifs cumulés croissants nicî en fonction des 
modalités Xj . 

Elle permet de déterminer la proportion des individus de la 
population dont le caractère est inférieur à une certaine valeur Xi. 
Elle est représentée par une courbe en "escaliers" dont les paliers 
sont horizontaux. 
Exemple : 

Soit la série statistique quantitative discrète suivante (des 

nombres de frères et sœurs de 30 étudiants). 
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Xi 


ni 


IljCC 





2 


2 


1 


3 


5 


2 


5 


10 


3 


10 


20 


4 


7 


27 


5 


2 


29 


6 


1 


30 




N=30 





30 
29 

27 



20 



10 



5 



4, 



O 



i 



; ; 

: : 

r*-r 






7 

: 

■ 



2 3 4 5 

Courfcç cumulative 






*; 
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Représentation des données 



Pour la lecture du graphique, on dit par exemple que 20 

étudiants ont moins de 4 frères et sœurs. 

b.- Variables statistiques continues : 

Comme pour ce type de variables, il y a une infinité de 
valeurs intermédiaires nécessitant le recours à des classes, on ne 
peut pas utiliser le diagramme en bâtons. On se propose d'utiliser 
la représentation des surfaces des classes par un histogramme. 

*-' L'histogramme : 

Pour tracer l'histogramme d'une variable statistique 
quantitative continue, on doit distinguer deux cas selon si les 
amplitudes des classes sont égales ou différentes. 

*- Cas des amplitudes égales : 

Exemple : 

Soit la série représentant les notes des étudiants en 

Informatique : 



[ei-i, eif 


ni 


fi 


[0,5[ 
[5,10[ 

[10,15[ 
[15,20[ 


60 
120 
200 
20 


0,15 
0,30 
0,50 
0,05 




N=400 


i 



f. = n ' 



N 
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On remarque que l'amplitude de a» = e* - ei-i = 5 pour toutes les 
classes. 



% 



0,30 



0,15 



0,05 




0.30 



Histogramme des fréquences relatives 

L'histogramme est la surface hachurée. 

On peut aussi représenter un histogramme pour les ni 

*- Cas des amplitudes différentes : 
Exemple : 

Le salaire annuel des 100 employés d'une entreprise se 
répartit comme suit : 
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Salaire annuel en 1000 Dh 


Nombre d'employés 


[0,30[ 
[30,50[ 
[50,90[ 
[90,1 20[ 


10 

48 

34 

8 


Total 


100 



Représentons l'histogramme de cette distribution. 

Pour homogénéiser la distribution et tenir compte de 
l'inégalité des amplitudes, on dresse le tableau suivant : 



[ei-i, e,[ 


nj 


fi =m/ N 


ai= ei - ei-i 


hi=m/ai 


[0,30[ 


10 


0,1 


30 


0,33 


[30,50[ 


48 


0,48 


20 


2,4 


[50,90[ 


34 


0,34 


40 


0,85 


[90,1 20 [ 


8 


0,08 


30 


0,27 




N=100 


1 







Alors, on représente l'histogramme pour h, (hauteur des 
rectangles). 
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Représentation des données 




Histogramme des hi 
*- Polygones des fréquences : 

Partant de l'histogramme et joignant par des segments de 
droite les milieux des sommets des rectangles, on obtient le 
polygone (des effectifs ou des fréquences). 

Exemple : 

Reprenons l'exemple des notes des étudiants en 
Informatique I, lorsque les classes ont des amplitudes égales : 
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Polugones des fréquences 
Il est préférable d'ajouter deux classes fictives aux 
extrémités de la série pour obtenir un polygone parfait 

Remarque : 

Il y a toujours conservation de la surface puisque l'aire sous 

le polygone est égale à 1 (en fréquence) (voir parties hachurées sur 
le graphique qui se compensent). 

Exemples : 

Pour l'exemple des salaires annuels des 100 employés d'une 

entreprise on a : 
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2.4 












i 






O.Sô 


~f 


\ 








A. 

\ 

\ 


s 

\ 





















% 







30 



50 



90 



128 



Remarque : 

En faisant un ajustement graphique du polygone des 
fréquences, ce dernier tend vers une courbe continue appelée 
"courbe des fréquences". 

2.- Les caractères qualitatifs : 

a.- Les graphiques en tuyaux d'orgue : 

Ce type de graphique représente en abscisse les différents 
caractères (xi), de base constante, et en ordonnées la hauteur 
correspondant aux effectifs ou aux fréquences. 

Généralement, on a tendance à ordonner les (xi) selon un 
ordre décroissant en partant de l'origine des axes. 

Exemple : 

Les participants au\ jeux olympiques selon le continent 
d'origine : 
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il 

140 
130 

$0 



W?" 



fJY'S, 



//,. / 



50 'f?k — 



m 




'S'// 

' v - 

m 



6mm 



Xi 


m 


Afrique 


80 


Amérique 


100 


Asie 


140 


Australie 


30 


Europe 


130 



F 



7y 
.... 



£A 



.- 



m 






m 

ni 



m 



' 



*€o° 



w8o 






mit £-js Ani Ah A 



♦.S.; 
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Diagramme en tuyaux d'orgue 

*- Diagramme à secteurs : 

C'est un diagramme visualisant les parts relatives dans des 
secteurs de cercles. Chaque secteur correspond à une modalité, 
l'angle au centre est égal au produit de 360° par la fréquence fi. 
Exemple : 

Reprenons l'exemple précèdent. 

Le nombre total des participants est de 480. 

on 

• L'Afrique correspond à x360 = 60" 

1 480 
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Règle de trois 



100 

L'Amérique-» x 360 = 75 

480 

140 
• L'Asie-* x 360 = 105 

480 



480 -> 360' 
80 -tx 



80x360 tn 

x= = 60 

480 



L'Australie 



L'Europe 



30 



480 
130 



x 360 = 22,5 



480 



x 360 = 97,5' 
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Exercices 

Exercice n Q l : 

Pour chacune des distributions statistiques SI et S2 suivantes: 

1) Définir la population statistique, l'unité statistique, le 
caractère(en précisant sa nature (quantitatif ou qualitatif), la 
variable statistique et sa nature (si elle existe), le nombre de 
modalités que présente le caractère. 

2) Construire (pour les distributions à caractère quantitatif) le 
diagramme en bâton ou histogramme et courbes cumulatives. 

3) Construire pour les distributions à caractère qualitatif les 
diagrammes à secteurs. 

Tableau SI : 

Répartition des hôtels homologués par le commissariat Général au 

tourisme au 1* janvier 1968 selon leur catégorie : 



Catégorie (nombre 
d'étoiles) 


Nombre d'hôtels 


1 étoile 


8346 


2 étoi les 


3770 


3 étoiles 


1161 


4_étoiles 


259 


5 étoiles 


48 



CI» 



VW 



:4* 
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Tableau S2 : 

Sur un rapport de 50 pages, on a relevé le nombre de fautes de 
frappe. On a obtenu le tableau suivant : 



Nombre de fautes 
de frappe 



1 
2 

3 
4 
5 
6 



Nombre de pages 



8 

12 

15 

8 

4 

3 



0UM -X) 



Exercice n°2 : 

Les salaires mensuels en dirhams des 50 employés d'une 
entreprise sont donnés par le tableau suivant : 



Salaires en 

DH 
■ 0-1500 



>^o 



1 8^ 



1500-3000 
3000 - 4500 
4500 - 6000 
6000 - 7500 



Nombre 
d'employés 



3 
15 
20 
8 
4 



i te 



1) Calculer: 

a) Tous les types de fréquences. 

b) Les centres des classes. 

2) Représenter l'histogramme et le polygone des fréquences. 

3) Quel est le pourcentage des employés qui ont un salaire : 
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a) Inférieur à 3000 DH/mois ? O , l£ r loo = 36 ?, 
F ' td b) Supérieur à 4500 DH/ mois ? ** I *-V *f o« «- i-</£ 
P &* '>>* c) Entre 3000 et 4500 DH/mois ? ° ' w * f ° ° * U ° C ^ 
d) Inférieur à 2800 DH/mois ? [ 15 oo, 3 o 00 [—s b , ?é 
Exercice n° 3 : [lSoo,l&> c Ç-*, oc 



La distribution des salaires mensuels dans une entreprise 



est donnée par le tableau suivant (en Dhs) : 



[ei-i ; ei[ 


ni 


<5000 


12 


[5000 ; 6000[ 


15 


[6000 ; 7000[ 


27 


[7000 ; 8000[ 


33 


[8000 ; 9000[ 


30 


[9000 ; 10000[ 


20 


>10000 


13 






1) Calculer les fréquences relatives et les fréquences relatives 
cumulées croissantes et décroissantes. 

CAO" 1 ^3a)* 

2) Quel est le pourcentage des salariés qui gagnent moins de 

7000Dhs/moîs? O^rtho- ^ 6 

3) Quel est le pourcentage des salariés qui gagnent plus de 

8000 Dhs/ mois? \j £ j v , y{ 



L o , '2>3 + 



bS? = 0;^ï 
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Caractéristiques de tendance 

centrale 

L-Introduction : 

Les caractéristiques des distributions statistiques est un 
outil essentiel de comparaison, se réfèrent à la tendance centrale 
(position), à la dispersion et à la forme (concentration). 
Les caractéristiques de position ou de tendance centrale sont le 
mode, la médiane et les moyennes. 

II.- Le mode (Mo) : 

Le mode est la valeur (M =Xi) la plus fréquente de la 
variable, c'est-à-dire celle pour laquelle : 

* La fréquence est maximale, ou 

* L'effectif est le plus grand. 

1.- Cas de la variable quantitative discrète : 

Le mode correspond à la valeur x, de la variable ayant la 
fréquence la plus élevée dans un tableau statistique. 
Exemple : 

Soit la distribution statistique représentant le nombre de 
frères et sœurs des étudiants, 



Xi 


ni 





1 
2 
3 
4 
5 
6 


2 
3 
5 
10 , 




7 
2 
1 






N=30 





Mo=3 puisque l'effectif le plus grand est égal à 10. 
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Graphiquement, le mode correspond à la valeur x* 
possédant le plus haut bâton dans un diagramme en bâtons. 



10- 




2.- Cas de la variable quantitative continue : 

Dans ce cas, les données sont groupées en classes et le mode 

est représenté par la classe modale correspondante au plus grand 
effectif. Mais, il faut distinguer deux sous cas, lorsque les 
amplitudes des classes sont égales et lorsque les amplitudes sont 
différentes. 

Exemple pour le cas des amplitudes égales : 

Soit la série représentant les notes des étudiants : 



Toutes les ai égaie à 5. 



[fil, Pi] 


ni 


[0,5{ 
[5,101 


60 
120 
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La classe modale est [10,151, puisqu'elle correspond à 

l'effectif le plus grand. 

le mode correspond : 

-s au centre de la classe modale : 

.. 10 + 15 25 .,„. 
M =— ^— = T = 12,d 

o ou graphiquement, à une valeur donnée par la méthode des 
diagonales: ni 



hi = 200 - 



hi.,=120. 




5 10 M„ 15 20 

ei-2 eto ei e,+i 



Xi 



et on a la formule: 



Mo =e,-i +t a 



h ,-> + h,., 



(0 



ou la formule: 



Mo=e>-i + 



2u=h 



lJ. 



(h.-hi*i)+(hi-hi-i) 



(H) 
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par application de ( I ), on a : 



M p = 10 + 2 ° 5 = 10 + — = 10 + 0,714 
120 + 20 140 



M =10,714 



Exemple pour le cas des amplitudes différentes : 

Lorsque les amplitudes de classes sont différentes, on 

définit la classe modale comme étant celle du plus grande hauteur 

dans l'histogramme (h ( = — ), (h, représente la fréquence 

a i 

moyenne par unité d'amplitude). Il se peut avoir plusieurs classes 
modales. Dans la classe modale, il faut choisir ou sélectionner un 
point comme mode. Ce point se trouve donc dans la zone de la 
classe où il y a le plus d'observations. 



Soit la série statistique : 



U^h 5 ^ A'**H> /;K>J* 



[ei-i, ei[ 


ni 


a s 


j— i 1 

hi=ni/ai 




[100, 200[ 


15 


100 


0,15 




[200, 400[ 


25 


200 


0,125 




[400, 600[ 


40 


200 


0,2 




[600, 700[ 


35 


100 


n ^ *— 








[700, 1000[ 


20 


300 


0,067 





La classe modale est [600, 700[ (et non pas [400, 600[ qui a 
m=40 qui est le plus grand) car [600, 700[ correspond à h, le plus 
élevée. 



On applique la formule : 
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M t »e M + hitl 



h ,-i +hui 

on a: e,.i=600 ; ei-700 ; 

aplOO 

h M =0,2 et h,*i=0,067 

donc M Q = 600 + 0y06/ 1 00 - 625,1 

0,2 + 0,067 

Remarque: 

Le mode ne doit être retenu que s'il est unique (série 

unimodale). Lorsque la distribution est rnultimodale, le mode 
perd toute signification. 

IIL- La médiane (Mé) : 
1.- Définition: 

La médiane est la valeur de la variable statistique qui 

partage la série statistique en deux parties de total des effectifs 

égaux, en supposant au préalable que la distribution soit 

classée par ordre de valeurs croissantes ou décroissantes de la 

variable. 

Deux cas se présentent : 
1 er cas : si le nombre d'observations est impair (2k+l), alors il suffit 
de déterminer la médiane qui sera le (k+l)* 1 ™' terme. 
Exemple : 
Soient les notes obtenues par 7 étudiants à l'examen : 

fy 10,12,9,13,8,7,11 ^.V->it ^ 

Classons cette série dans l'ordre croissant : 

7,8,9,10,11,12,13=>Mé=10 



Mé 
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Puisqu'on a sept termes, la médiane correspond à 10, car il y a 
trois valeurs à gauche de 10 et trois valeurs à sa droite. 



2' 1 ""' cas : si le nombre d'observations est pair 2k, alors la médiane 

est donnée par l'intervalle médian de borne inférieure la valeur 

fctme e t d e borne supérieure la valeur (k+l)* mifc de la série. On prend 

comme médiane la moyenne (la centre de l'intervalle) des bornes 

de l'intervalle médian. 

Exemple : 

Soit maintenant la série suivante : 



5,6,7,8,9,10,11,12,13,14 ^' ltU 
il y a dix valeurs, 10 = 2x5=>k = 5* me et k+l=6* me , le 5**» est 9 et 
le 6 e ** est 10 

9+10 



Mé = 



= 9,5 <£ IN 



Comme on est dans le cas discret et 9,5«Ê IN, on ne peut pas 
la prendre comme une vraie médiane. 
2- Méthode pratique de recherche de la médiane : 
Exemple 1 : Soit la série statistique suivante : 



Xi 


ni 


nxc 


1 


1 


1 


3 


2 


3 


5 


7 


10* 


7 


6 


16 


9 


4 


20 




X=20 





N 20 m i 
— = — =10, valeur 

2 2 

existante parmi les 
n*cc 



Mé=^ = 6 



IQfcw = fcfc» k+'l 



■ ■m» 1 



II 



13 355555537777779 9 99 

V _ >* '^ s 
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-4 



Xi 


ni 


riicc 


1 


1 


1 


3 


3 


4 


5 
7 
9 


7 

3 
6 


11* 
14 

20 




M=20 





N 20 m > 

— = — = lu, valeur 

2 2 

existante parmi les 
nicc 



Mé = 5, 



10*nw e tH*nw 



13335555555,777999999 

1 ' 



Mé= 5 -±1 = 5 



Lorsque la série statistique n'est pas unitaire, c'est-à-dire 
lorsque les effectifs sont différents de 1 (ni * 1), alors si 

N = Z n i est 'effectif total, on caractérise la médiane comme étant 

la valeur qui a la moitié des observations (N/2) inférieures à elle. 

On cherche la valeur N/2 parmi les effectifs cumulés 
croissants, deux cas peuvent se présenter, soit i! existe un n* tel 
que N/2=nh-, soit aucun n» ne vérifie N/2=n i( . 

Dans le cas où il existe un n^N/2, on sera dans la même 
situation que celle du cas d'un nombre pair d'observations, alors 
les deux positions centrales de la série ordonnée sont Xi et x.+i, on 

prend, comme médiane la valeur moyenne Mé = Xi +X ' M 

2 

Dans le cas où n u * N/2 pour tout les n*, alors la valeur x, 

correspondante à l'effectif cumulé où pour la l 6 » fois ni. > N/2, 

occupe l'unique position centrale ou les deux positions centrales. 
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X. + X; 



On prend alors comme médiane Me = Xi ou Mé = ' ' c est-à- 
dire que Mé = xi. 



Exemple 3: S oit la série statistique suivante : 

Mé 

II 
5,6,6,8,9,10,10,10,11,12,13 



qua 



<n è& 



Xi 


ni 


mec 


5 


1 


1 


6 


2 


3 


8 


1 


4 


9 


1 


5 


@) 


3 


& 


11 


1 


9 


12 


1 


10 


13 


1 


11 



N=ll=>N/2=5,5 
n'existe pas parmi les 
njcc 

il est dépassé pour la 
l te fois en 8 
=> 10 = Mé 



N=ll 



3,- Cas d'une variable continue : 

Dans ce cas, les valeurs sont regroupées en classes. La 

médiane se calcule d'abord par détermination de la classe 
médiane [e,-i, ei] qui correspond à la valeur de ni,- ■ N/2 ou à la 
l' r " valeur des nu qui dépasse N/2 dans le cas ou tous les n IC sont 
différents de N/2. 

Exemple 1 : 

Soit la série statistique suivante : 
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yJ 

3 .6 



[ei-l, ei[ 


ni 


nicc 


[0,1 0[ 


48 


48 


[10, 20[ 


52 


100* 


[20, 30[ 


60 


160 


[30, 40[ 


40 


200 




N=200 





N/2 - 200/2 =100, cette valeur existe exactement parmi les n ic 

=* la classe médiane (c'est-à-dire l'intervalle qui contient la 
médiane) est [10, Wj-feb *] et on prend Mé= e 4 

=20. 

Exemple 2 : ^ 

Les salaires annuels des employés d'une entreprise (en '■ 
milliers de DH) sont distribués comme suit: 1H 



[ei-l, ei[ 


ni 


nicc 


[40, 50( 


12 


12 


[50,60[ 


14 


26 


[60, 70[ 


20 


<J6 ■ 


[70, 80[ 


g* 


76* 


[80, 90[ 


14 


90 


[90,1001 


10 


100 




N=100 





Me >s 



H fc _JZ-\ 



^ 



N/2 - 1 00/2 =50, cette valeur n'existe pas parmi les mec 



42 



-€ETUUP 



.corn 



Statistique Descriptive 



Caractéristiques de tendance centrale 



la classe médiane est la classe qui correspond à n*. qui dépasse 
le premier la valeur 50 c'est-à-dire [70, 80]=[e i .i / et] et ensuite, on 
applique la formule : 



N 
Mé «e M + -^— - -a 



\'C /-. 



n ; 



Mé = 70 + -^-^10 = 7133e [70,80] 
30 



Interprétation : 

On a ; N/2=50 et Mé = 71,33 . 10 3 DH = 71 330 DH 

Il y a 50 employés qui ont un salaire inférieur à 71330 DH et 
50 autres qui ont un salaire supérieur à 71330 DH. 

4.* Méthode graphique de détermination de la médiane : 

On trace la courbe des fréquences (ou des effectifs) 

cumulées croissantes et la courbe des fréquences (ou des effectifs) 
cumulées décroissantes sur le même repère. La projection du point 
d'intersection de ces deux courbes sur l'axe des abscisses donne la 
valeur de la médiane. 

Exemple : 

Soit la distribution de l'exemple précédent ; 



[e,-i, ei[ 


n; 


met 


nii-1 


[40,tgi 


12 


U 


100 


[@,60[ 


14 


26 


® 


[60, 70[ 


20 


46 


74 


[70, 80[ 


30 


76 


54 
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[80, 90[ 
[90,1 00[ 


14 
10 


90 
100 


24 
10 




N=100 







Traçons la courbe des incj et des njci sur le même repère 
nie 

100 



50 




T r 



on voit que la médiane est presque égale à la valeur trouvée 
algébriquement 71,33 

IV." Les moyennes : 

Généralement, il y a quatre types de moyennes : 
arithmétique, géométrique, harmonique et quadratique. 

I.- Moyenne arithmétique ( \ ) : 

La moyenne arithmétique d'une variable statistique est 
égale à la somme des valeurs de la variable pondérées par les 
fréquences relatives. 
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* = S f,X, 



i = 1 



donc 



k n 1 k 
x = V— l -x- = — Vn.x. 

ffN 1 Mft f ' 




d'où 



Fxemple : 

Soient les notes d'un groupe de 30 étudiants 



Xi 


n; 


ni Xi 


f, 


fi Xi 


7 


4 


28 


0,133 


0,931 


8 


5 


40 


0,167 


1,336 


9 


6 


54 


0,2 


1,8 


13 


7 


91 


0,233 


3,029 


14 


6 


84 


0,2 


2,8 


15 


2 


30 


0,067 


1,005 


Total 


N=30 


327 


»-i 


10,901 



La note moyenne de ce groupe est : 

_ i i, « 

* ■ Tj~2* n i x , = — -327 = 10,9 sur 20 
w i=i 30 

x = X f i x . =10,901 *10 rf 9 

i ■ I 

*- Variable statistique continue : 

Pour le calcul de la moyenne arithmétique dans le cas de la 
variable statistique continue, il faut procéder par la formule 
suivante : 



- 1 \r 
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où Ci représente le centre des classes. 
Exemple : 

L'âge des salariés d'une entreprise est distribué comme 
suit: 



le,-!, &[ 


ni 


Ci 


n;Ci 


[10, 20[ 


2 


15 


30 


[20, 30[ 


15 


25 


375 


[30,40[ 


33 


35 


1155 


[40, 50[ 


13 


45 


585 


<£hisde"5(}) 


7 


©? 


385 


Total 


N=70 




2530 



Lorsque la borne n'est pas définie, il faut la définir soit par le "bon 
sens" soit par extrapolation des données. Ici, on peut dire que : 

• L'âge de la retraite est de 60 ans, donc la classe "plus de 50 
ans" est ; [50, 60[, 

• On a des classes d'amplitude 10, donc la dernière sera de 
[50, 60[. 

- 1 NT 1 

Ainsi X = —2, ri 1 C 1 = — .2530=36.14 

IN i= i 7U 

36,14 est l'âge moyen des 70 salariés de l'entreprise. 
*- Calcul de x par changement d'orieine : 

Lorsque les valeurs xi et ni sont trop grandes et que le 
calcul devient volumineux, il est préférable de procéder à un 
changement d'origine par la transformation suivante : 
Si Ct est une origine quelconque, soit le changementx'^X; -c io , 

alors la moyenne sera x' = x-c v d'où la moyenne arithmétique 
recherchée sera x = x 1 4- c. 
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Exemple : 

Soit l a série statistique suivante : 



[eu, ei[ 


ni 


Ci 


Ci - C3=C'i 


n f c'i 


[400, 500 [ 


8 


450 


-200 


-1600 


[500, 600 [ 


10 


550 


-100 


-1000 


[600,700[ 


12 


<g(T) 








[700, 800[ 


50 


750 


100 


5000 


[800, 900[ 


20 


850 


200 


4000 




N=100 






6400 



Cio = C3 = 650 ; le choix de cette valeur s'est fait par le choix de la 
valeur centrale des observations. 



or 



x = x-c 3 => x = x + c 3 

5?« x6400 = 64 donc 

100 



x = 64 + 650 = 714 



*- Propriétés de la moyenne arithmétique : 

1) La somme des écarts à la moyenne arithmétique est 

nulle: tn l (x,-x) = 
En effet : 

*< _ i _ ï _ _ 

X n i( x i - x ) = X n i x i ~ x X n > =Nx-xN = 

2) La somme des carrées des écarts à x est minimale, c'est- 

k _ 

à-dire: ^n^x^ -x) 2 est minimale. 
En effet : 

k 

soit la fonction Y(y) = £n,(x É ~ y) 2 

M 

on va démontrer que Y est de dérivée première nulle en yo=xet de 
dérivée seconde positive (concavité vers le haut) 
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♦ y 



ona:Y(y)=rX n i( x i _2x,y + y 2 ) 

k k 



- E n . x i - 2 yZ n i x » + y'Z n * 



i=i 



i="l 



i=l 



<JY k k k k 

— - «2£fl|X| + 2y£n i = « y£n 4 = £n fXi 



i^l 



î-1 



i=l 1*1 

c> y = 77Z n i x «= x 



donc Y admet un extremum (optimum) en x . 



dy 2 £ 

d'où Y admet un minimum en x (concavité vers le haut). 

2- Moyenne géométrique G : 

Elle est égale à la racine N iiMlw du produit des k valeurs 
d'une série statistique. 

a- Cas d'une série simple : 

Tous ses N valeurs sont d'effectifs égaux à 1, alors : 
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G= ^/x, ,x : x N = (x t .x ; 

G = 



*n>* 



•A Y» 

n*. 

f N 



1 I - 

lo g G= T7 lo g 3 [ x 



donc logG= — X lo g^i 

d'où on a supposé que V i=l, . . ., N 



x,>0 



b- Cas d'une série pondérée : 

Ses valeurs xi, ,Xk ont des effectifs différents ni, , nu 

respectivement. 



\;t 



G-!fc?'.x;' x- m n x,- -n 



i=l 



n jl a 



N 



i=l 



N = ni+n2+ +nk 



G-nx: 



i, i 



f K 



log G = log H x? = X l°g* ? = Z f . lo S x i 



< i = l 



i=l 



i-1 



ici, aussi, on a supposé que xt>0 Vi=l, ...,k 

Remarque : 

La moyenne géométrique est utilisée pour le calcul des taux 
d'accroissements moyens, des moyennes de coefficients 
multiplicateurs... c'est-à-dire, dans les cas où la variable représente 
des variations cumulatives. 
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Exemple 1 : 

Calculer la moyenne géométrique de la distribution de 
fréquence suivante : 



Xi 


ni 


1 

2 
3 


2 ■ 
3 




N-10 



On peut utiliser des logarithmes népériens ou décimaux 
sans changer le résultat de G* 

Alors utilisons les logarithmes décimaux, on aura : 



Xi 


ni 


logxi 


ni log xi 


1 

2 
3 


2 
5 
3 




0,301 
0,4771 



1,505 
1,4313 


Total 


N=,|0 




2,9363 



Alors 



1 k 

,0 s G = TrZ n i |o s x i 

™ 1=1 

= — 29363 = 0,29363 

10 

G = 10 O,29V,, = 1(97 



Exemple 2 : 

Le chiffre d'affaire d'un projet a produit les augmentations 
annuelles suivantes : 
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Année 


Augmentation en % 


l ère année 
2 ème année 
3ôme année 
4 ènw année 
5*"* année 
6 èmp année 


4% 

O 'o 

6% 
6% 

5% 
5% 



L'augmentation moyenne annuelle est une moyenne 
géométrique 



G= VOÔ4)â06)-(l,05) : 

G = 1,05331 
soit un taux de croissance de 5,331 % approximativement. 

En effet ; si C G est le chiffre d'affaire au début de la l iMre année, à la 

fin de cette année il devient : Co+C- -^- =C ( 1+0,04) = 1,04 C = 

100 

G, ce chiffre G devient à la fin de la 2* me année G + G- — =1,06 

100 

Ci = C2 et ainsi de suite, à la fin de la 6 eme année, le Co devient 

Cf = 1,05 . 1,05 . 1,06 . 1,06 . 1,06 . 1,04 G, 



-^- = (1,05) 2 (l,06)\l,04=G h 



ainsi, l'augmentation 
éo métrique 

G 

G 
soit un taux de 5,331 % . 



moyenne annuelle est la moyenne 

^/(l,04)(l,()6)- , (l.05) 3 
1,05331 
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3.- Généralisation de la moyenne : 

L'expression de la moyenne peut se généraliser de 
plusieurs manières, une d'entre elles est ce que l'on appelle la 
moyenne d'ordre r, notée M r , définie par : 



k 



! 



(M r r = £f,c;« M r = £f iC [ 

Ainsi, la moyenne arithmétique est un cas particulier avec r =1, 
c'est-à-dire Mi=x. 

On peut montrer que G = Mo par passage à la limite et par des 
théorèmes pratiques de dérivation des fonctions. 

I 

G = M = Iim M E = limf Y £c?Y 

4.» Moyenne harmonique H : 

On définit la moyenne harmonique comme la moyenne 
généralisée d'ordre -1. Elle se note H 



-i 



-i 









-1 



k n ^ 




C'est la formule du cas d'une série pondérée 
*- Cas d'une série simple : 
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Remarques : 

La moyenne harmonique se calcule pour des valeurs de la 
variable X non nulles et elle n'a de signification concrète que si 

l'inverse — de la valeur X* a un sens. 

Elle est utilisée pour le calcul des moyennes de 
pourcentages, de ratios et de rapports, de même que pour l'étude 
du pouvoir d'achat (inverse du mouvement général des prix), etc. 

Exemple : 

Une imprimerie a imprimé 500 livres à la vitesse de 400 
livres par heure et elle a imprimé 1000 livres identiques à la vitesse 
de 350 livres par heure. On veut déterminer la vitesse moyenne 
pour imprimer les 1500 livres. 

< * '1300 1500 

Alors c est H = 



Hl Hi ?9° 100 ° 
x, x 2 400 350 

1500 m .. ,, 

= = 365 livres/ heure en 

1,25 + 2,86 

moyenne. 

5.* Moyenne quadratique Q : 

La moyenne généralisée d'ordre r =2 s'appelle la moyenne 

quadratique. 

i 

k n 



Q-H.-IZ«tf -fëft*? 



*=l J 
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y - Cas d'une série simple : 



Q=JX>:*; 



m 



Exemple : 

Calculons Q de la série suivante : 



Xi 


n; 


x? 


mxî 


2 


7 


4 


28 


4 


10 


16 


160 


5 


20 


25 


500 


7 


30 


49 


1470 


9 


15 


81 


1215 


10 


10 


100 


1000 


11 


8 


121 


968 




N=100 




5341 



5341 



Q % E£L.J$4Ï«7J1 



I0O 



Remarque : 

On peut montrer que les moyennes généralisées d'ordre r 
d'une même série statistique vérifient : 



p<q 



alors 



M r <M, 



ainsi 



M.i<M..<M[<M2 



c'est-à-dire 



H<G<x<Q 
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Exercices 
Exercice n° 1 : 

Au cours d'une enquête dans une entreprise, on a relevé les 20 
salaires suivants: 1800, 2200, 2000 , 3800, 3500, 1700, 2600, 2800, 
2200, 2600, 2400, 2300, 2100, 2400, 3500, 2600, 2400, 2100, 1800, 
2600. 

1) Calculer le salaire moyen x . 

2) Regrouper les 20 salaires en tableau, avec les classes ci-dessous: 
[1500 ; 2000[ ; [2000; 2500[ ; [2300 ; 3000 [ ; [3000 ; 3500 [ ; 

[3500 ; 4000 [ 

Tracer l'histogramme correspondant en précisant la hauteur de 
chaque classe. A quelle valeur Xj du salaire moyen conduit ce 
classement. 

3) Si l'on regroupe les deux dernières classes préciser la 
déformation subie par l'histogramme précédent. 

A quelle valeur x : du salaire moyen conduit ce nouveau 
classement ? Conclusion? 



Exercice n ° 2 : 

La répartition de 100 exploitations agricoles selon leur 

superficie, exprimée en hectares (ha), est donnée par le tableau 

suivant : 



Superficies (en ha) 


Nombre 


comprises entre 


d "exploitations p", 


10-20 


10 


20-30 


15 


30-40 


25 


rio^To 


30 


50 - 60 


10 


60 - 70 


r> 


70 - 80 


4 



4 




± 


k 


\r-CC 


nec 


«,1 


o,1 


l< 


OjK 


o,2é a. 






Va 


ù '\ï 


C,ot 


0,°* 


0,«P 


4 7i 


1 







) Calculer tous les types de fréquences. 
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2) Déterminer le mode et la médiane graphiquement et par le calcul. 
Donner leurs interprétations. 

3) Quel est le pourcentage des exploitations agricoles qui ont une 
superficie : 

a) Inférieure à 30 ha ? 

b) Supérieure à 40 ha ? 

c ) Comprise entre 30 et 40 ha ? 
d) Inférieure à 47 ha? 

Exercice n : 3 : 

Sur un rapport de 50 pages dactylographiées, on a relevé le 

nombre de fautes de frappe par page. On a obtenu le tableau 
suivant : 



Nombre de fautes: 


Effectifs 


Xi 


ni 


1 


8 


2 


12 


3 


15 


4 


8 


5 


4 


6 


3 



1) Que représente Zni 

2) Calculer Zxini .En déduire le nombre moyen de fautes par 
page. 

Exercice n 4 : 

On se donne la série statistique suivante :1 , 2 , 5,7, 10, 13. En 

utilisant un coefficient de pondération identique calculer les 
moyennes arithmétique, géométrique, harmonique et 
quadratique. 
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Exercice n J 5 : 

La distribution, en pourcentage, de 50 employés d'une 

entreprise selon leurs salaires mensuels (en dirhams) est donnée 
par le tableau suivant : 



Salaires en DH 


Pourcentages 


compris entre 


des employés 


- 1500 


6 % 


1500 - 3000 


30 % 


3000 - 4500 


40 % 


4500 - 6000 


16% 


6000 - 7500 


8 % 



1) Calculer les fréquences relatives et déduire les différents 
effectifs. 

2) Calculer les fréquences relatives cumulées décroissantes et 
représenter leur courbe. 

3) Quel est le salaire le plus fréquent ? 

4) Quel est le salaire médian ? 

5) Déterminer le salaire moyen par la méthode directe et par 
un changement d'origine convenable. 

Exercice ir 6 : 

Une entreprise produit un certain bien. Elle dispose de 3 

usines A, B et C dont les rendements sont 20 unités par jour pour 
A, 32 pour B et 40 pour C. 

L'usine A a produit 8000 unités, l'usine B a produit 9600 et C a 
produit 12000, pendant une période déterminée. 
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Quel est le rendement moyen de cette entreprise pendant cette 
période ? (Justifier le choix de la méthode utilisée). 

Exercice n c 7 : 

La durée de l'unité téléphonique de base entre 2 villes A et B est 

de 20 secondes; cette unité est facturée 50 centimes par 

l 'ad ministra tion. 

Une durée inférieure à 20secondes génère 1 unité et coûte donc 50 

centimes. 

Une durée comprise entre [20s ; 40s [ génère 2 unités et coûte 100 

centimes et ainsi de suite. 

Le tableau suivant représente la distribution de la durée X (en 

secondes) et du nombre d'unités Y correspondantes, des 

communications téléphoniques entre les 2 villes A et 

B. 



Durée X (en 


Fréquence fi 


Nombre 


seconde) 


(en %) 


d'unités Yi 


[120; 140[ 


2 


7 


[140;160[ 


6 


8 


[160;180[ 


12 


9 


[180;200[ 


20 


10 


[200 ; 220[ 


18 


11 


[220 ; 240[ 


14 


12 


[240; 260( 


10 


13 


[260 ; 2S0[ 


7 


14 



58 



-€ETUUP 



.com 



Statistî 



tive 



Caractéristiques de tendance centrale 



(280 ; 3O0[ 


5 


15 


[300 ; 320[ 


3 


16 


(320 ; 340[ 


2 


17 


(340 ; 360[ 


1 


18 



1) Quelle est la nature statistique de la variable X? Même question 
pour Y. 

2) Déterminer le coût moyen d'une communication entre A et B . 

3) Trouver la relation entre le centre ci de la i èmp classe et la valeur 
yi de Y associée 

En supposant que la distribution des durées est uniforme à 
l'intérieur des classes, calculer la durée moyenne d'une 
communication. 

4) L'administration envisage de faire passer la durée de 
l'impulsion de base de 20s à 40 secondes. Une étude préalable a 
montré que ni le nombre ni la distribution de la durée des 
communications ne seraient affectés par une telle mesure. 
Calculer la baisse des recettes engendrée par cette décision. 
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Chapitre 3 : 



Caractéristiques de dispersion 



h- Introduction : 

Les caractéristiques de tendance centrale vues 
précédemment ne nous permettent pas de faire la différence entre 
deux séries statistiques. En effet, deux séries peuvent avoir la 
même moyenne arithmétique et la même médiane sans qu'elles 
soient identiques. On introduit alors, autres caractéristiques dites 
de dispersion qui estiment dans quelle mesure les observations 
s'écartent les unes des autres ou de leur valeur centrale. 
Les caractéristiques de dispersion sont : 



l'Etendue, 
les Quantités, 
l'Ecart absolu moyen, 
la variance et l'Ecart -type 
le coefficient de variation, 
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IL- L'Etendue : 

1.- Définition : 

L'Étendue ou l'Intervalle de Variation est la différence en tre la 

valeu r la plus faible et la va leur la plus élevée d'une série 

statistique. 

2.- Exemple : 

On considère les salaires des employés de deux entreprises A et B : 

Pour A; 700, 720, 750, 800, 900, 1000, 1150 

Pour B : 20, 100, 200, 800, 1300, 1600, 2000. 

On a X*=X*=860et M&-A4&-800 

Même si les moyennes arithmétiques et les médianes de ces deux 

séries sont identiques, on ne peut conclure qu'elles sont identiques 

car l'information sur le groupement/ l'écart (la dispersion) des 

éléments des séries n'est pas disponible. 

Calculons l'étendue pour ces deux entreprises : 

Pour A, l'étendue est de 450=1150-700 

Pour B, l'étendue est de ] 980=2000-20 

La dispersion est donc plus forte pour B que pour A. 

3.- Exemple : 

Sur 1000 employés d'une entreprise, l'étendue de l'âge est 
de 11 ans (49 ans -38 ans), il suffit qu'un jeune employé (sur 1000) 
de 18 ans soit embouché pour que l'étendue passe à 31 ans (49 ans 
- 18 ans) ! On voit donc que l'étendue est une manière très 
simpliste de mesurer la dispersion. 



€ETUUP 

.corn 



Statistique Descriptive Caractéristiques de dispersion 

III.- Les Quantiles : 
1>- Définition: 

Les quantiles sont les valeurs de la variable statistique qui 
partagent la distribution en "n" parties composées du même 

effectif" — ", 
n 

Exemple : 

La médiane est un quantile qui partage la distribution en 

N 
"2" parties composées du même effectif " — ". 

Remarques : 

- Les quantiles en eux-mêmes sont des caractéristiques de 
position (non centrale), tandis que l'intervalle mesurant l'écart 
entre deux quantiles et une caractéristique de dispersion. 

- Pour la détermination des quantiles, on suppose que les 
valeurs de la série statistique sont classées dans un ordre 
croissant ou décroissant. 

2.- Les quartiles : 
a.- Définition : 

Les quartiles sont les trois valeurs que Ton note Qi, Q2, Qi 
de la variable statistique qui partagent la distribution en "4 

N 
parties composées du même effectif " — ". 



'M" 



62 ^ETlttJP 

.com 



Statistique Descriptive Caractéristiques de dispersion 

4 25% >< 75% > 



1 r 



< N_— -><— N; >< H— -»< N_ 

4 4 4 4 

^ Q> ^ Q 2 =Mé <£ 50% > 

50% 

* 75% > Ql < 25% — 



*L 



Remarque : x x 

.- P M 

Il v a N— observations à gauche (inférieurs) de Qi, i=l, 2, 3 
J \ 4 

b.- L'intervalle interquartile : 

C'est la différence entre Qa et Qi. Soit Qs - Qi ; il contient 
50% des valeurs de la variable présentés par la moitié centrale des 
effectifs observés. Cet intervalle élimine l'influence des valeurs 
extrêmes. 



c.-La dérivation Quartile ou le semi-interquartile est égale à 

Q3-Q1 

2 

d.-l/ écart interquartile relatif : 

Pour comparer la dispersion entre deux séries statistiques 
ayant des unités différentes ou dont l'ordre de grandeur n'est pas 
le même, on utilise l'écart interquartile relatif donnée par : 

Q,-Q. 
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3,- Les déciles : 
Définition : 

Les déciles sont les 9 valeurs Di, D2, . .., Ds et D9 de la 
variable statistique qui partagent la distribution en "10" parties 

composées du même effectif " — " et qui ont, donc, 
N — observations inférieures à chaque D, , i=l, 2,..., 9. 



< 50% 

< 20% " 



Q 2 =Mé=D 5 m% 

1 — 1 — £ " — ■ 1 — 1 

Di D2 D 5 D» 

N ^ 

10 10 



4.- Les percentiles : 
»- Définition : 

Les percentiles sont les 99 valeurs Pi, P 2 , ..., P 9 s et P99 de la 
variable statistique qui partagent la distribution en "100" parties 

composées du même effectif »—» ayant, donc, N 

lui) 

——observations inférieures à chaque Pi, i=l, 2, ..., 99. 

1 uu 



M 
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50% 



7% 



■*- 



1% 



P5o=Q 2 =Mé=D 5 



w N 



100 100 

*- Remarque: 

Le calcul des quantiles est pareil à celui de la médiane, en 

changeant la fréquence — (nombre d'observations inférieures à la 

médiane) parN — (nombre d'observations inférieures au quantile 

n 

d'ordre — cherché), 
n 

*- Exemplel (cas du variable discr ète "pondérée") : 

Calculer les percentiles 55 et 75 de la série statistique 

suivante : 
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Xi 


ni 


riicf 


3 


3 


3 


4 


7 


10 


8 


30 


40 


10 


20 


60«- 


11 


15 


->75 


20 


25 


100 



Au 



N=100 



1)N— =100— =55 
100 100 

On cherche ce 55 entre les nicj 

=> il n'existe pas exactement mais 60 

est la 1*"" valeur qui dépasse ce 55 

alors Pss = 10 






2> N Ton =75/ dans ce cas oui ^ p?5 = ^r^ =15 ' 5 

*- Exemple2 (cas du variable continue) : 

Calculons les déciles troisième et septième de la 
distribution statistique suivante : 



[ei-i, e ( [ 


ni 


nicj 


[0, 10[ 


4 


4 


[10, 30[ 


8 


12* 


[30, 35[ 


13 


25 


[35, 80[ 


S 


30" 


[80,100[ 


3 


33 


[100, 1501 


7 


40 1 




N=40 





N-— =12 
10 

cette valeur apparaît dans le 

tableau*, alors on prend Dî = e2 

c'est-à-dire Ds = 30 
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D 7 = ? 

N— =28 
10 

Cette valeur ne se trouve pas exactement dans le tableau, 

mais 30** est la l ere valeur qui la dépasse, on applique alors la 

formule : 



D 7 = ei-i + 



M 7 



10 



à 



n 



Qui vient de la formule générale : 



N--n, : c 
Quanti le = en + — - a 



n 



r\ 




2R — 2S 1 

D 7 = 35+ — — (80-35) = 35 + --45 = 35 + 27 







5.- Boite de Tuckey. Diagramme de Box & Wiskers : 

Considérons le diagramme en boîte ci-dessous, qui est la version 
la plus simple de la boîte de Tuckey, appliquée à la variable X. 
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O 



A'inm Ql Gh Qs Xmax 

On distingue sur ce schéma la « boîte de Tuckey » qui est le 
rectangle construit sur le premier quartile Qi et le troisième Q3. 



IV.- L'Ecart absolu moyen : 

L'écart absolu ntoven est la somme des valeurs absolues 
des écarts à la moyenne arithmétique, multipliées par les 
fréquences relatives. 






OU 




t ('• I* 1 - yl 



UK, 



5.».-» 



r 
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Remarque : 

Si l'écart absolu moyen d'une série statistique est grand 
(resp. petit), on dit que la série est très dispersée (resp. peu 
dispersée). 

V.» La variance et l'écarMvpe : 

• La variance d'une variable statistique X que l'on note Var(X) 
est la moyenne arithmétique des carrés des écarts des valeurs de 
la variable à leur moyenne arithmétique écarts des valeurs de la 
variable à leur moyenne arithmétique. 

L'écart-type d'une variable statistique X que l'on note Ox est 
la racine carrée de la variance de X. 



ax=V^W=^tn i (x i -x) 2 

ax est donc la moyenne quadratique des écarts à la moyenne 

arithmétique. 

*- Simplification des calculs de la variance : 

Pour simplifier le calcul de la variance, on peut utiliser un 
changement d'origine ou développer la formule de la façon 
suivante : 

Var(X) =2>i -*)^-£<*î -2XX, + x 2 )f, 

|«1 1*1 

Var(X) =ixff 1 -2xXx,f, + x ! Xf, 

= x =1 
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Var(X) = 



f k 



f v 

-2x 2 +x- = 



u*i 



Z>& 



xi = l 



-x 2 



Var(X) = 



f k ^ 




f 


z*ft 


-x" = 




V M > 




k. 






-x 2 



Le dit changement d'origine affecte la variance de la forme 
suivante : 

x\=\,-x, =>x',4-x, = x,=>x'+x, =x 



M 

Je 



k 

L»1 



Var(X) =X(x, -x) 2 f, = £((x? + x, j )-(x'+x J) 2 f ( 



= I(x, 2 -x 2 ) 2 f i =Var(X l ) 



i-1 



Donc le changement d'origine n'affecte pas la valeur de la 

variance. 

Exemple : 

Calculer la variance, en utilisant les simplifications des 
calculs, pour la série suivante : 



[ei-i, e,[ 


ni 


Ci 


c 2 =ci-25 


nicf 


nie'? 


[0. 10[ 


1 


5 


-20 


-20 


400 


[10, 20[ 


*> 


15 


-10 


-20 


200 


[20. 30[ 


3 


25 











[30, 40[ 


4 


35 


10 


40 


400 




N=10 









1000 



70 



>€ETUUP 



.corn 



Statistique Descriptive Caractéristiques de dispersion 

On a pris c, - 25 = c 3 



Var(X 



')'^t^ 



Nfe 



\ — -1000 -f— 1 =100 



10 110 

Donc Var<X) = 100 

et Gx= VVar(X)=VÏÔÔ = 10 

*- Variance intrasérie et variance intersérie : 

Supposons que l'on peut considérer deux sous-séries d'une 
série statistique. Alors il est possible de déterminer la variance 
globale de la série si l'on connaît les variances de ses deux sous- 
séries. 

On a: 
La moyenne de la série mère est la moyenne pondérée des 
moyennes des deux sous-séries : 

X=^-(N 1 x ]+ N 2 x 2 ) 

avec N est l'effectif total de la série mère 

M, et Xi sont l'effectif total et la moyenne arithmétique d'une 

sous-série. 

La variance de la série total est égale à la moyenne des variances 
des deux sous-séries augmentée de la variance des moyennes des 
deux sous-séries. 
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1 



Var(X)=-[N 1 Var(X I ) + N : Var(X : )] + ±[N 1 (x 1 -x) 2 +N 2 (x 2 -x) 2 ] 



N 



V 



Moyenne des variantes 



Var(X.) 
II 
Variante intrasérie 



Variances des moyennes 



Var(X,) 
II 
Variance intersérie 



Remarque : 

• La variance intrasérie est la variance que l'on obtiendrait si 
les deux sous-séries avaient la même moyenne (égale à la 
moyenne globale x, = x 2 = x). 

• La variance intersérie est la variance que l'on obtiendrait si 
chaque variable de chaque sous-série était égal à sa 
moyenne (sous-séries homogènes). 

Exemple : 

Soit la série globale des salaires du personnel d'une société 
mère X composée de deux filiales Xi et X2. 





fil 


aie X, I 


filiale X 2 ï 


Société mère 






effectif 

n, 


salaire x. 


effectif 

n, 


salaire x, 


effectif 
ni 


salaire x t 




Cadres 


10 


8(1 


5 


71) 


15 


76,67 




Techniciens 


20 


18 


10 


16 


30 


17,33 




Ouvriers 


30 


10 


100 


s 


136 


8,46 






NI = 
60 


X, =24>33 


\2 = 
115 


X. =11.39 


N T = 
175 


X =15,83 
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Calculons la variance globale, variance inlrafiliale et 

variance interfiliale. 
Variance globale : 



Var(X) = 



'l k 






_j_ 

_ 175 

Var(X) =359 
Variance intrafiliale : 



-X 



((15 x 76,67 2 ) + (30 x 17,33 2 ) + (130 x 8,46 2 )) - (15,83) : 



Var(X , ) = i|)N , Var(X , ) + N , Var(X , )] 



avec 



Var(X,) = 



f n k \ 

— 5>,x? 



-x 2 



Var(X, ) = — {(lûx 80 2 )+ (20xl8 : )+ (30x 10 2 ))- 24,33 2 = 632,72 
60 



f 



Var(X 2 ) = 






,N 2 fr 



Var(X 2 ) = ^ : ((5x7O 2 )+(l0xl6-)+(l00x8 : ))-ll,39 2 =161,23 

ainsi Var(X \ ) = -\ [(60 x 632,72 )+ (1 15 x 161.23)]= 322 

i /<d 

Variance intprfitiale : 

Var(X,) = — [n,(Xi-X) 2 +N,(X:-X) 2 ] 

Var(X, ) = ■£- [60 (24,33 - 1 5,83) 2 + 1 1 5(11,39 - 15,83) 2 ] 
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Var(X,)~37 



Conclusion : 



Var(X)=Var(Xi)+Var(X,) 
359 = 322 + 37 

VI.- Le coefficient de variation : 

II est égal au rapport de l'écart-type à la moyenne et il est 
présenté sous forme de nombre abstrait sans dimension et 
indépendant des unités de mesure. 




Le coefficient de variation permet de donner une idée sur 
l'amplitude de variation en comparant I'écart-type et la moyenne. 
Ce rapport est généralement exprimé en pourcentage. 



c =ax,» 



Plus le coefficient de variation est petit plus la série est homogène. 
D'une manière générale, la population étudiée est considérée 
homogène lorsque le Cv < 30%. 
Exemple : 

Calculer G pour l'exemple des deux filiales Xi et X2 
précédents : 

Cvf v n _q(X')_12,7 -, 1? 
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c**fH8frw 



la dispersion relative des salaires et presque identique dans 
les deux établissements. 



Exercices 
Exercice n°l : 

Les salaires annuels {en itf DH) de 100 ouvriers d'une entreprise 
sont distribués de la manière suivante : 



Salaires (en 10 3 DH) 


Nombres des 


compris entre 


ouvriers 


J25 et 26Q 
26 et 2ST 


13 | 


15 


28 et 30 


21 


[5ÔeT32f 


19 


32 et 34 


15 


34 et 35 


10 


35 et 36 


7 




-J 1c. 



304-^t - *>\ 



1 ) Calculer les fréquences relatives et les effectifs cumulés croissants. 

2) Déterminer le nombre des ouvriers qui ont un salaire annuel inférieur 
à 32000 DH. 

3) Déterminer le pourcentage des ouvriers qui gagnent moins que 28350 
DH par an. 

4) Déterminer le salaire annuel le plus fréquent graphiquement et par le 
calcul . 

5) Déterminer la médiane de cette distribution et inteipréter le résultat. 

6) Calculer le salaire annuel moyen de ces ouvriers. 
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7) Calculer les quartiles Qi et Qs de cette distribution. 

8) Déterminer sa variance et son écart-type. 
Exercice n°2: 

Une étude sur l'épargne locale auprès des agences relevant 
des délégations provinciales de la Poste a permis d'établir les 
caractéristiques des versements à la caisse d'épargne, au cours 
d'une journée type, dans la région Tanger-Tétouan. Ces 
caractéristiques sont résumées dans le tableau ci-après : 



Etat de versement à la 
Caisse d'épargne 


Tanger 


Tétouan 


Nombre de 
versements 


35 


30 


Versements moyens 


2200 


2400 


Variances des 
versements 


3025 


3600 



1) Donner le versement moyen pour l'ensemble de la région 
Tanger-Tétouan. 

2) Calculer la variance intra-ville et la variance inter-ville des 
versements. 

Quelle est la variance régionale des versements ? 

3) Comparer la dispersion des versements à Tanger et 
Tétouan, en utilisant le coefficient de variation. 
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Exercice n°3 : fi 

Une enquête sur la mobilité a donné la répartition suivante 
{exprimée en %) pour une population d'individus domiciliés à la 
région Tanger-Tétouan, selon la distance entre le domicile et le 
lieu de travail (distance exprimée en kilomètres) : 



Distance 


Tétouanais 


Tangérois 


(en km) 


(en %) 


(en %) 


[0,21 


5.7 


3.1 


[2,6[ 


12.0 


7.7 


[6, 10[ 


6.3 


6.8 


[10,151 


8.1 


4.6 


[15, 25[ 


11.0 


6.8 


[25, 50[ 


11.2 


5.4 


[50, 60[ 


7.8 


3.5 



1. Calculez la distance moyenne parcourue par un travailleur 
tétouanais et par un tangérois. 

2. Déterminez la variance et I'écart-type des distances 
parcourues par un travailleur tétouanais et par un 
tangérois. 

3. Calculer le coefficient de variation pour les distances 
parcourues par un travailleur tétouanais et pour celles 
parcourue par un tangérois. Conclure. 
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Exercice n°4 : * 

^ttvtvffvttmftmvfiwiwfnfiffti* 

Les salaires annuels (en 1000 DH) des employés d'une entreprise 
composée de deux filiales X et Y sont réparties selon le tableau 
suivant : 



Salaires en 

1000 DH 

compris entre 


Nombre d'employés 
de la filiale X 


Nombre d'employés 
de la filiale Y 


10 et 20 
20 et 30 
30 et 40 

40 et 50 


5 
10 
13 
4 


4 
12 
14 
6 



1 ) Déterminer le salaire moyen de la filiale X et de la filiale Y. 

2) Déterminer la variance et l'écart-type des salaires de la filiale X et 
de la filiale Y. 

3) Comparer la dispersion des salaires de la filiale X et de la filiale 
Y. 

Exercice n Q 5 : xjr 

Le tableau ci-dessous donne les chiffres d'affaires mensuels 
réalisés par un magasin pendant n nombre de mois. 






Chiffre d'affaires 


Nombre de mois (ni) 


(en 10* DH) 




[MI 


3 


[4,6f 


4 


[6,81 


m 8 


[8,101 


5 


[10, 14[ 


n 5 g. 


[14,18[ 


6 



78 



^ETUUP 



.corn 



Statistique Descriptive Caractéristiques de dispersion 



[18, 24[ 
[24, 30[ 


6 
13 



On donne en plus les informations suivantes: 

-la densité d'effectif de la 3ème classe est le double de la deuxième 
-la densité d'effectif de la cinquième classe est identique à celle de 
la quatrième. 

1) Définir pour cette distribution : la population statistique, l'unité 
statistique, le caractère et la nature de la variable statistique. 

2) Déterminer m, ns et n. 

3) Tracer l'histogramme de cette distribution. On présentera au 
préalable un tableau précisant pour chaque classe, son amplitude 
ai et la hauteur de chaque classe hi (sans utiliser les fréquences) 
représentée sur l'histogramme. En déduire sa classe modale en 
précisant sa signification. 

■4) Calculer le chiffre d'affaires mensuelles médianes Me par 
interpolation linéaire, en précisant l'hypothèse sous-jacente à cette 
méthode. 

5) On regroupe la 4" me et la 5*' m " classe ensemble. Calculer dans ce 
cas le chiffre d'affaires mensuels moyen .v et l'écart type o de la 
variable étudiée. 

6) En utilisant ces résultats calculer le pourcentage des 
observations contenues dans un intervalle symétrique I de 
longueur 2o et centré en x (I =[ x -o , x +o ]) 
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Chapitre 4 



Caractéristiques déforme 



I.- Introduction : 

Lorsque l'on représente graphiquement une série 
statistique, on peut remarquer qu'une telle distribution présente 
une symétrie ou non, mais pour la mesurer, par exemple, on doit 
utiliser une caractéristique de forme. 




Mode 
Médiane 
Moyenne 

Distribution symétrique 




Mode Me Moyenne 



Distribution asymétrique 



80 



>€ETUUP 



.corn 



Statistique Descriptive. 



Caractéristiques de forme 



IL- Les Moments: 

l.-Moment simple : 

Le moment d'ordre r d'une série statistique par rapport à 

une valeur quelconque x„ est : 



m -^È( x '- x *) r n. 



si 



xo = alors m r =^-Jxfni 



ce qui donne le moment simple d'ordre r. 
Remarques : 

* La moyenne arithmétique 

— 1 k 

X=— Yx n. =m, est le moment simple d'ordre 1 

Mm 



Le moment simple d'ordre est 



1 



m, 



*— Yx"n = — Y/r= — 



=£», 



Nt 



N*?, 



N 



2,-Moment centré : 

Lorsque x„= x , on obtient le moment centré d'ordre r : 



pr=ïki(Xi-x) r ni 



N£ 



SL r est pair, \i t est un paramètre de dispersion. 
Si r est impair, \x , est un paramètre de symétrie. 
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En particulier : 



6 = 



1 vp 1 _ k 



= rrE x . n i -T7 x Ê n i =x-x=o 



„#& N^ ' Né 

et M2=-^S( x i ~*) 2 *i =Var(X) . 

3.- Relation entre mr et ux : 

En utilisant que Vx et Vv des réels 



(x + y) r = £ C^x'^y 1 Formule de binôme de Newton 



!■! 



ou les identités remarquable (a - b) 2 , (a + b) 2 ,..., on obtient : 

/ î 

V" >«*%*" P: = m 2 -mj 

p, =m,-3m,m 2 +2m, 

p 4 =m 4 -4m 1 m, + 6m 1 : m, -3mf 

p 5 = m- -5m,m 4 +10m 2 m, -4mf 

...etc. 

IIL- L'Asvmétri^ 

Une distribution statistique est symétrique si sa 
représentation graphique est symétrique par rapport à l'axe 
\ ertiral x = \ou si les valeurs équidistantes de sa valeur centrale 
ont une fréquence égale. 
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Dans ce point central, lorsque là série est symétrique, 
coïncident la moyenne arithmétique, la médiane et le mode. 

x ■ Mé = Moj 
(s'il y a plus d'une seule mode, coïncident seulement 
Exemplel : 

x- — = 7 
14 

2 2 
Mo = 7 

x= Mé = Mo = 7 



Xi 


nj 


riiCÎ 


niXi 


3 


3 


3 


9 


5 


2 


5 


10 


7 


4 


9* 


28 


9 


2 


11 


18 


11 


3 


14 


33 




N=14 




98 



3 4 3 ê S 



* * 



7 *i* *+ 



Diagramme en bâtons des ru 
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Exemple2 : 



Xi 


ni 


IliCÎ 


niXi 


3 




5 


15 


5 


1 


6 


5 


7 


3 


9* 


21 


9 


1 


10 


9 


11 


5 


15 


55 




N-15 




105 



- 105 _ 

x= = 7 

15 



N 15 „ Xlc „ 

— = — = 7,5=>Mé = 7 
2 2 



Mo = 3 et 11 




î-iu 



Diagramme en b a ton s 

Lorsque la série statistique n'est pas n'est pas symétrique, 
on dit qu'elle est asymétrique et alors on a plus x = Mé =Mo. 

On peut mesurer son asymétrie par le coefficient de 
Pearson qui se définit par : 
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En effet, si la série est symétrique et elle a un seul mode, alors 
x=MoetA r =0. 



Mo= X 



Le coefficient d'asymétrie le plus important et le plus utilisé est le 
coefficient de Fisher que se définie comme : 



g,= J 



o(x)' 



Q» fffwr Hî 



1 k 

-ec u = — Y (x - x) ? n , est le moment centré d'ordre 3. 
Nuï 

• si gi = alors la distribution est symétriqu e. 

• si gi < alors la distribution est asymétrique à gauche ou 
on dit qu'elle est oblique à droite. 



85 



-*ETIMJP 



.corn 



Statistique Descriptive. 



Caractéristiques de forme 



X< Mo 



X ïilo 



• si g! > alors la distribution est asymétrique à droite ou on 
dit qu'elle est oblique à gauche. 



X > Mo 
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IV.- L'Aplatissement 

Une série statistique est plus ou moins aplatie suivant que 
les fréquences des valeurs proches des valeurs centrales sont plus 
au moins élevées par rapport aux autres. 

Les mesures d'aplatissement s'appliquent aux distributions 
uni modales et symétriques ou peu asymétriques. 



plus aplatie 



metns aplatie 



Entre les deux cas, il existe un cas normal ou moyen c'est le 
cas des distributions moyennement aplaties. 
Les séries statistiques plus aplaties sont dites 
PLATYKURTIQUES. 

Les séries statistiques moins aplaties sont dites 
LEPTOKURTIQUES. 

Les séries statistiques moyennement aplaties sont dites 
MÉSOKURTIQUES. 

■PLATUS" signifie large. 

"LEPTOS" signifie mince. 

"MÉSO" signifie moins que, inférieur à, manque de... 
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"KURTOSIS" signifie sommet ou bosse. 
Pour mesurer le degré d'aplatissement, on utilise le coefficient 
de Kurtosis. 




• si g2 - alors la distribution est mésokurtique ou 
normale. 

• si g 2 < alors la distribution est platykurtique. 

• si g2 > alors la distribution est leptokurtique. 

Exercices 

Exercice n°l : 

Le tableau ci-dessous donne les chiffres d'affaires mensuels 
réalisés par une entreprise commerciale pendant 36 mois : 



Chiffres d'affaires 


Nombre de 


(en 106 DH) 


mois (ni) 


[3,6( 


7 


[6,8[ 


6 


[8, 10[ 


5 


[10, 14[ 


8 


[14,18[ 


6 


[18,23f 


4 



1°) Calculer le mode et la moyenne de cette série statistique. 

Cette distribution statistique est-elle symétrique ? Pourquoi ? 
2°) Calculer sa variance et son écart type 
3°) Déterminer son coefficient de variation. Conclure. 
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Exercice n Q 2 : 

On étudie les revenus (Annuels en milliers de dirhams) d'un 

ensemble de familles d'un quartier de Tétouan, les données sont 
regroupées dans le tableau suivant : 



Revenus 
annuels 
(en 10* 
DH) 


[18;30I 


[30; 36[ 


[36;42[ 


[42;54[ 


[54 ; 60| 


[60;66[ 


Effectifs 


13 


219 


20 


46 


50 


82 



1. Préciser les caractéristiques de cette série (population, taille 
ou l'effectif total, individu, caractère étudié, type de 
caractère et modalités). 

2. Calculer la moyenne x de cette série statistique 

3. Dresser l'histogramme de cette série statistique puis 
représenter son polygone. 

4. Déterminer le mode Mo de cette série, graphiquement et 
par le calcul. 

5. Calculer la médiane Me de cette série statistique en 
explicitant vos calculs. 

6. La série étudiée est-elle symétrique ou asymétrique? 
Justifier votre réponse. Pouvait-on prévoir ce résultat? 



89 



-€ETUUP 



.corn 



Statistique Descriptive. Caractéristiques de concentration 

Chapitre 5 : 



Caractéristiques déconcentration 

L- introduction : 

Plusieurs phénomènes économiques nécessitent des études 
de concentration et répartition d'une des variables dont ils 
dépendent. Par exemple, la concentration des salaires, des 
revenus, de production,. . .etc. Les caractéristiques déjà vues 
comme la moyenne, la variance, etc.. ne répondent pas à cette 
étude, alors on a construit de nouvelles caractéristiques dites de 
concentration mais due à la nature des problèmes étudiés, on 
considère que des variables continues à valeurs positives. 
IL- La médiale (Mïi : 

La médiale est la valeur de la variable statistique telle que la 
somme des observations inférieure à elle est égale à la somme des 
observations supérieure à elle. Donc, c'est une médiane sur les 
valeurs "nio" au lieu des "ni". Pour cela la médiale se calcul de 
forme analogue à la médiane. 
Exemple : 

Calculons la médiale des salaires annuels du personnel (en 
milliers de DH) d'une entrepris : 
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[a* e il 


ni 


Ci 


nid 


(niCi)cî» 


[40, 50[ 


12 


45 


540 


540 


[50, 60[ 


14 




770 


1310 


[60, 70[ 


20 


65 


1300 


2610 


[70, 80[ 


30 


75 


2250 


4860* 


[80, 90[ 


14 


85 


1190 


6050 


[90, 100| 


10 


95 


950 


7000 




N=10O 




7000 





On a ^ n,C ' = ^^ = 3500 . On cherche cette valeur dans la 
2 2 

colonne des (n,Ci)cfr. la l prt ' valeur qui la dépasse est 4860. Donc la 

classernédialeest[70,80[ 

On applique, alors, une formule analogue à celle de calcul de la 

médiane : 



X"<<\ 



-<» M c,,)r1 



Ml = La + 



a 



Il c 



K4, = 70 + iHz^., 0-73.96 



Tl 



50 



Interprétation : 

La masse salariale de l'entreprise, versée annuellement aux 
employés montre que le partage en 2 blocs égaux s'effectue pour 
la valeur de 73.960 DH. Autrement dit, la moitié de la masse 
salariale est reçue par le personnel qui a un salaire inférieur à 
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73.960 DH et l'autre moitié est ret;ue par ceux qui ont un salaire 
supérieur à 73.960 DH. 
Calcul de la concentration : 

II existe plusieurs démarches pour effectuer ce calcul, la 
plus simple se compose des étapes suivantes : 

• Calcul de la médiane de la série. 

• Calcul de la médiale de la série. 
Mesure de l'écart médiale-médiane (ÀM). 

Comparaison de cet écart à l'intervalle de variation de la 
série. 
Calcul de la concentration pour l'exemple précédent : 

On a déjà calculé, pour cet exemple, la médiane et la 
médiale, on a : 

Mé = 71,33 et Ml = 73,96 

AM = Ml - Mé = 73,96 - 71,33 = 2,63. 

L'intervalle de variation est : 100 - 40 = 60, d'où 



,., _^d =«3=0.043 

intervalledevanation 60 



En générale, l'indice I = ^ = MI-Mé 

intervalEedevariation étendue 

est une valeur comprise entre et 1 qui mesure la concentration, 
indiquant une grande concentration lorsqu'elle est grande (proche 
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de 1) et une équi-distribution lorsqu'elle est petite {proche de 

zéro). 

Si I = 0, alors il y a équi-distribution absolue. 

Si I = 1 , alors il y a maximum concentration. 

Donc, pour l'exemple, les salaires sont équi-distribués. On a 
la concentration est faible. 
III.- Courbe de Lorenz et Indice de Gini: 

1,- Courbe de Lorenz : 

Considérons, le cas de l'étude de la variable qui représente les 
salaires d'un groupe d'ouvriers. On a construit le tableau suivant 
pour analyser la concentration des salaires : 



[«!*«[ 


ni 


Ci 


njcj 


met* 


(B|CJCi s 


Pi = n < cî ioo 


(n.cjcl 


100 




[p.v ei[ 


R| 


C| 


IHC î 


nict" 


Gtttfdcf 


Pi 


qi 








112 


ca 


naca 


nxrt" 


(nï^kt* 


r* 


q* 






[e.i, <-,[ 


IV 


e» 


ne* 


n t ct* 


(fV,)c* 


p« 


• 
<* 






[tVl. t*k[ 


riK 


Ck 


WeCk 


nk»4" 


(ni^kV^ 


? - 


< 

^ 








N 




2w 
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Où les produits "nie" représentent la masse salariale reçue par Les 
"ni" ouvriers dont le salaire est compris entre e.i et e*. 

Les "(n^cr représentent la masse salariale reçue par les 
"nict" ouvriers avec des salaires inférieurs à cette masse. 

Les valeurs n p" représentent, en pourcentage, les 
fréquences relatives cumulées des ouvriers. 

Les quantités "q^ représentent la masse salariale cumulée 

(exprimées en pourcentage) sur la masse salariale totale Y n.q . 

i 

Les deux dernières colonnes de tableau nous informent sur 
la concentration des salaires. 

La distribution des ouvriers et des salaires exprimée par les 
valeurs (p s , qi); i=l, ..., k, se représente graphiquement à l'aide de 
la courbe de concentration appelée courbe de Lorenz; c'est la 
courbe qui passe par les points (pi, q,) 



4M - 




En gras c'est la première bissectrice. 



* F 
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* Si les salaires sont équi-distribués, alors pi=q, (Vî=l, ..., k), donc 
la courbe de Lorenz coïncide avec la !*■ bissectrice. 

m Dans le cas de maximum concentration q,=0 0=1, ..., k-1) et 
qk=lOÔ, alors la courbe déconcentration coïncide pratiquement 
avec le triangle OAB. 

a Pour des situations de concentration intermédiaires, la courte 
de Lorenz occupe une position intermédiaire entre ces 
situations extrêmes. Elle s'approche plus à la I e » bissectrice 
lorsque la concentration est faible et s'éloigne de la 1*« 
bissectrice lorsque la concentration est forte. 

2.- Indice de Gini 

A partir de la courbe de Lorenz, on construit une mesure de 

degré de concentration appelée "Indice de Gini" notée "le". 
Géométriquement, 

l'aire 5 



l <. = 77 



aire du triangleOAB 



et on a ;0<L<1 
Evidement, cet indice est une mesure de l'approximation de 
ld courbe de Lorenz à la l |,r " bissectrice et par suite de la 
concentration des salaires. 
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k-i k-1 

— =1-' 



Ic=^ 



k-\ 



2> Zp. 

■ ri M 

qui mesure aussi l'approximation de la courbe de Lorenz à la 1 èr * 
bissectrice mais en utilisant une autre propriété géométrique 

différente de celle de l'aire S. 

■ Si Ir.= alors pi=qi et les salaires sont équi-distrihués. 
«a Si Ig= 1 alors qi = et il y a maximum concentration. 
j Si 0< fc< 1 alors il y a grande concentration si le. est 

plus proche de 1 ; et une équi-distribution si le est 

plus proche deO. 

Exemple : 

Reprenons l'exemple précèdent ; on a calculé l'indice I pour 

cet exemple et on a trouvé I = 0,043. 

Calculons, maintenant l'indice de Gini le. 



[ei-i, e f [ 


ni 


C| 


"»ci 


nid" 


(meOct 


p. = ncT 100 

r ' N 




100 




[40, 5()[ 


12 


45 


540 


12 


(540 


12 


7.71 






[50, 60( 


14 


55 


770 


26 


1310 


26 


IS,71 






[60, 70[ 


20 


(ô 


1300 


46 


2610 


46 


37,28 






[70, S0[ 


30 


75 


2250 


76 


4&6G 


76 


6^>,43 






[KO. 90[ 


14 


85 


il*) 


90 


6050 


90 


86,43 






[90,10Û| 


10 


l »5 


950 


]l 10 


701 Ht 


101) 


100 








N-100 




7000 
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Si nous observons les deux dernières colonnes nous avons : 
Au 12% des ouvriers qui gagnent peu leur correspondent le 7,71% 
du total des salaires, au 26% des ouvriers qui gagnent peu leur 
correspond le 18,71% du total des salaires, etc.. Alors que s'il 
avait une répartition égalitaire des salaires, nous aurons que au 
12% des ouvriers leur correspond le 12% du total des salaires, au 
26% des ouvriers leur correspond le 26% du total des salaires, 
etc.... ce que l'on n'a pas dans cet exemple du à une telle 
concentration des salaires (même fiable !). 




ÎSU * 



L'indice de Gini 



k.= 



250 



Sp. 



Ï=I 



I.. = 1-0,878 = 0,122 
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Ce qui indique une faible concentration des salaires de ce groupe 
des ouvriers. 

Exercices 
Exercice n°l: 

Soit la série statistique des salaires d'une entreprise : 



Salaires 


Nombre d'employés 


X-50 


30 


50-100 


40 


100 - 200 


20 


200 - 300 


10 



1) Retrouver la borne inférieure X de la première classe sachant que 
le salaire moyen est de 94. 

«Pour la suite des calculs, retenez la valeur trouvée à la première 
question.) 

2) Donner l'interprétation et la valeur de la médiane (Mé). 

3) Calculer le troisième quartile. le septième décile et le percentile 
35. 

4) Déterminer la variante et l'écart-type. 

5) Donner l'interprétation et la valeur de la médiale (Ml). 

6) Que peut-on dire de la différence AM=MI-Mé ? Comparer-la à 
l'étendue. Interpréter le résultat. 

7) Construire la courbe de Lorenz. 
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8) Déterminer l'indice de concentration de Gini. Conclure. 

Exercice n°2 : 

Pour une même durée de travail, les salaires d'une 

entreprise se répartissent comme suit : 



Salaires en 


Nombre de 


dirhams 


personnes 


De 3000 à 4000 


11 


De 4000 à 5000 


26 


De 5000 à 6000 


63 


De 6000 à 7000 


81 


De 7000 à 8000 


35 


De 8000 à 9000 


21 


1 De 9000 à 10 000 


13 



1°) Déterminer le salaire médian. 

2°) Déterminer la médiale. 

3°) Tracer la courbe de concentration de Lorenz et calculer l'indice 

de Gini. Conclure. 

Exercice n" 3: 

La distribution des salaires horaires, en dirhams, des N 

employés d'une grande entreprise est donnée par : 
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Classes 


Effectifs 


[50; 1001 


10 


[100;150[ 


14 


[150;200[ 


16 


[200 ; 250[ 


n 



Ces données sont incomplet car, à la suite d'un incident, l'effectif 
de la dernière classe est illisible; alors, on a décidé de le noter 
provisoirement par n. Mais, on sait que la médiane de cette série 
statistique est 153,125 DH. 

1. Exprimer la moyenne arithmétique de cette distribution en 
fonction de n. 

2. Exprimer la médiane de cette série statistique en fonction 

de n, sachant que la valeur N/2 n'a pas été trouvée 

exactement parmi les effectifs cumulés croissants. 

Déterminer n et puis N le nombre d'employés de cette 
entreprise. 

3. Retrouver la valeur numérique de la movenne arithmétique 
en remplaçant la valeur de n trouvée dans l'expression de 
la moyenne exprimée en 1°. 

4. Calculer la médiate de cette série statistique. 

5. Représenter la courbe de concentration (ou courbe de 
Lorenz), 
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6. Calculer l'indice de concentration (ou indice de GINI) et 
conclure. 

Exercice n° 4: 

Le tableau ci-dessous donne la répartition de 200 

exploitations agricoles, dans un certain pays, selon la 5AU 
(surface agricole utilisée) exprimée en hectares : 



SAU (en ha) 


Fréquences (en %) 


de à 10 


22 


de 10 à 30 


28 


de 30 à 50 


27 


de 50 à 100 


23 



1) Déterminer le pourcentage des exploitations agricoles qui 
ont une SAU supérieure à 30 ha. 

2) Déterminer la SAU la plus fréquente. 

3) Donner la valeur et l'interprétation de la médiane (Mé). 

4) Calculer le troisième quartile(Qs) et le cinquième décile 
(D 5 ). 

5) Donner l'interprétation et la valeur de la médiale (Ml). 

6) Calculer la différence AM=MI-Mé. Calculer l'indice de 
concentration. 

Interpréter le résultat. 

7) Construire la courbe de Lorenz. 

8) Déterminer l'indice de concentration de Gini, Conclure. 
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Ajustement et corrélation 



Ajustement et corrélation 



linéaire 



L-jntroduetion; 



Dans ce chapitre, les variables statistiques sont supposées 
« discrètes ». Pour passer aux variables continues, il suffit de 
remplacer les classes par leurs centres. 
IL- Notion d'ajustement : 

Dans les chapitres précédents, nous avons vu que les tableaux 
statistiques ont au moins deux colonnes : 

• Une colonne pour les valeurs de la variable xi 

• Une colonne pour les effectifs ni ou les fréquences fi. 
Nous avons aussi procédé à des représentations graphiques. 

M 



oui 






': 
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-n 



Parfois, dans ces représentations graphiques, les points 
représentés semblent se repartir suivant une configuration assez 
régulière (une droite ou une parabole, ou une courbe). 

L'ajustement consiste en substituer aux effectifs ou fréquences 
effectivement observés des effectifs ou fréquences calculés à l'aide 
de procédés que nous allons envisager. 

On conçoit, en examinant ces représentations graphiques, que 
la première étape d'une opération d'ajustement sera la recherche 
de la forme générale de la courbe d'ajustement, la seconde étape 
étant la détermination de l'équation de la courbe d'ajustement, 
équation telle que : 

ni ou fx =/(a) avec/une fonction . 
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1- Ajustement graphique : 

Lorsqu'on a, dans une représentation graphique, un nuage de 
points, un première ajustement conduit à tracer une courbe simple 
régulière qui compense à peu près les écarts positifs ou négatifs 
c'est-à-dire qui laisse à peu près le même nombre de points de 
part et d'autre. 

Ainsi les deux figures précédentes conduiraient à des 
ajustements manuels qui se présenteraient approximativement 
comme suit : 



*\**t 





*l 



Dans le cas où les points semblent se répartir de façon linéaire, 
plusieurs droites peuvent-être candidates à ajuster ce nuage de 
points. 

Mais, ces droites sont parallèles régulièrement espacées de part 
et d'autre d'une droite centrale. La droite d'ajustement est la 
droite centrale de l'ensemble des droites telle que les points à 
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ajuster se répartissent équitablement au dessus et au dessous de 
cette droite, et à l'intérieur du réseau des parallèles. 

Cet ajustements manuel, bien que sommaire, donne en 
pratique de bons résultats surtout si la courbe d'ajustement 
cherchée est une courbe simple, une droite par exemple. 



Exemples d'ajustements graphiques linéaires : 



On dispose de tableau suivant : 



Xi 


ni 




2 


/ 




4 


10 




6 


1? 




a 


15 




9 


20 




13 


28 





La représentation graphique de cette série statistique est faite de 
six points. 
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Un ajustement linéaire est le plus approprié. 

Une droite d'ajustement a été construite manuellement et 
figure sur la représentation. On détermine facilement l'équation 
y=ax+b de cette droite en écrivant qu'elle passe par les points, 
M (4, 1 0) et À'(9, 20) 

On peut écrire 

20 = 9« + è 



5« = 10 ^« = 2 



et b=10-8=2 



Soit une droite d'équation y=2x+2 
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2- Méthode des points médians : 

Exemple : 

Un phénomène économique a fait l'objet d'une mesure 

mensuelle au cours de 20 mois consécutifs. 

Représentons graphiquement la série statistique en question et 
ajustons par la méthode des points médians les points obtenus. 



Mois 


Mesures 


Mois 


Mesures 


Mois 


Mesures 


Mois 


Mesures 


1 


17 


6 


198 


11 


196 


16 


216 


2 


164 


7 


190 


12 


208 


17 


226 


3 


168 


8 


188 


13 


218 


18 


236 


4 


172 


9 


188 


14 


202 


19 


232 


5 186 


10 


188 


15 


202 


20 


240 



On représente d'abord les 20 points de coordonnées 

respectives : 

(Ietl70);(2etl64);...;(20,240). 
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240 




1 2 3 4 5 5 7 g 9 10 II 12 13 M 15 lé 17 1S 19 20 



Util 



III.- Notion de corrélation : 

Parfois, on peut se trouver en face d'une population telle qu'on 
puisse étudier deux caractères différents sur une même unité 
statistique : 



Variable 1 : X 


Variable 2 : Y 


Xi 
Xi 

• 

• 
■ 

Xa 


• 
• 



n étant le nombre d'unité statistiques observées. 
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Une unité présente à la fois la mesure x\ de X et la mesure )'i de Y, 

avec/=7, ..., n 

Sur le tableau précédent, on pourra s'attacher à l'étude des 
variations simultanées (croissance ou décroissance) des deux 
caractères X et Y. 

Trois situations peuvent se présenter : 

1) Aucun lien entre X et Y. 

2) X et Y sont liés fonctionnellement. 

3) Sans être liés fonctionnellement, X et Y sont en 
dépendance, plus ou moins marquée. 

On dira alors que X et Y sont en corrélation (positive ou 
négative). 

Exemple : 

- Le poids et la taille des entants d'une école sont deux 

variables en corrélation positive. 
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1- Mise en évidence graphique de l'existence d'une 
corrélation entre deux variables : 

Sur un repère, on représente les points de coordonnées tirées 
du tableau précédent : 

&u yù ; te, y 2 ) ; ■ ■ - ; U, >\) ; . . . ; (v n , >a 

Les points formeront un nuage de points: 



• • 



♦ * * 



•• 



* • • ♦ • *•*• 



•• • ; •••♦• 



Ce nuage peut se présenter de divers façons ; 

à ) Les points se dispersent au hasard dans le plan : 

Comme dans la figure précédente. Alors X et Y peuvent être 
indépendantes l'une de l'autre (car le nuage ne présente pas une 
influence claire d'une variable sur l'autre). 
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b) Les points peuvent se regrouper en un nuage de 
forme assez allongée, assez aplatie : 



* • 



• 



■* X 



A une valeur fixée de l'une des deux variables correspondent 
des points qui présentent, pour l'autre variable, des valeurs assez 

rapprochées. 

Les deux variables semblent alors être liées, c'est-à-dire 
corrélées soit positivement (croissent ensembles), soit 
négativement (décroissernent ensembles). 

On peut alors dire que X et Y sont corrélées ou qu'il existe une 
corrélation entre X et Y. 

2- Mesure de la corrélation. Coefficient de 
corrélation linéaire : 

La corrélation est mesurée par un coefficient appelé le coefficient 
de corrélation linéaire. Les formules de coefficient de corrélation 
linéaire sont : 
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r as 



SU-^fe-fJ 1 



A 



rZfo-*)(y,-F) 



r = 



CovtX.Y) 






Cov{XJ) 



Cov(X,Y) 



yjVar(X)VarîY) C{X)o(Y) 



Donc, d'après ceci, on voit que - 1 < r < 1 



Si r = \ , alors on a une forte corrélation positive. 

Si T « — J , alors on a une forte corrélation négative. 

Si r = , alors on n'a pas de corrélation. 

Exemple de calcul du coefficient de corrélation linéaire entre 
deux variables X et Y ; 



-V. 



16 
t& 
23 
24. 

2â 

26 



V, 



2Z- 
24 
28 

32 



r. - S" 



91 * 5«"> 

261 | 3-3-S î 



-S I 
-3.1 
-2 2 

-15 

-O 1 
•4.fl 

•7.9 



y. - v 



ft - *V 



-;0 4 
-e.-a 

•2 4 

•S 4 
+ 1.6 

-2.4 

•13Ê 

- i a v 



1Q2-Z-1 
SS . à"! 
*61 
3 -4; 

£ «1 
â 41 

OJBt 
24 M 

54 Si 
6* 41 



- T :. J 



5 76 
70 S6 
2.56 

S. 76 

a 56 

Si 50 
1*2 56 

4-S3t.4iï 



», - S-l i y, - Y ;, 



*51 fe--: 
7 44 
i? *>A 
3 -G4 
-6 56 
-D ié 
-27 J.j 
-62 S4 
«3 74 
-353. 60- 
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Moyenne arithmétique de X : X = = 26,1 



— 304 
Moyenne arithmétique de Y : Y = : — = 30,4 



Coefficient de corrélation linéaire : 

T W 351,60 



JZU-Xr(y ( -F) : V314,90x492,40 



351.60 351,60 



Vl 55056,76 393,77 

Donc on a une corrélation positive, comme l'indique déjà la 
représentation graphique et assez serrée, le coefficient r ayant une 
valeur absolue voisine de 1. 

3- Droite de régression linéaire: Méthode de 

moindres carrées: 
a- Méthode des moindres carrées : 

Le problème à résoudre est le suivant : il faut déterminer les 
différents paramètres d'une fonction on : y =f(x) qui ajuste à la 
façon la plus satisfaisante les observations faites, la fonction 
retenue devant cependant conduire à une courbe 
d'ajustement : 
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*i 


y. 


Xk 


3\ 



>• Observations 



Supposons y =f(x) est l'ajustement envisagé (on a sa forme, 

son type, mais pas ses paramètres!) 

Graphiquement: 



y 








} '*> 


, /{nk-z,} 


A ixù 


Jw; 


N 


K*ù 


\ 

\ 

i 

ï 

1 

ï 
i » 1 


1 ' 


i ' 


1 p. 



Calculons 



JTi X Z ._- %. t X* 



.V 



[v, - /U,)f ;[>' 2 - /û 2 )] 2 ;-;[>;_, - /(-r M )f ;fo - f(x Â )) 2 

On trouve différentes valeurs de paramètres à déterminer qui 
conduisent à différentes fonctions / telle que y =f(x) 
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Alors, nous cherchons les paramètres qui donnent la fonction/qui 

rend la plus faible possible la somme des carrées [y, r - f(x, )]" 

(méthode des moindres carrés). 

Conclusion ; On cherche la fonction / telle que y = f{x) qui 

permettra de calculer les / (aï) tels que £ [y, -/(-*;)]" soit 

minimum observés calculée 

On dispose d'une distribution à deux variables statistiques X et 
Y pour laquelle la représentation graphique a montré que Y peut- 
être ajusté par rapport à X par une droite d'équation 
y=f(x)=ax+b. Alors, par la méthode des moindres carrées, il faut 
que : 

min£[_y, - f(x t )f c'est-à- dire min ^[v-av, -b\ 

Le problème consiste donc à déterminer les paramètres a et b. 

Rappelons que les valeurs numériques de X\ a* et >i, ..., y* 

sont connues et lues directement sur le tableau statistique. 

Nous allons calculer la dérivée par rapport à a et à b de 

V[v,-o\, -b\ , puis égaler à zéro les dérivées obtenues : 
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\(M 



da 



= 



v(=l 



rf/> 



= 



-2±{y t -ax t -b) = 



1=1 



-2'£{x,y i -axî-bx i ) = 
-2£(y, -**,-*) = <) 



k 









M 

i * 


-2>?- 

(l) 

(2) 


;=) 
-bk=0 



<=l 



1=1 






= v - ar 

k 



On remplace dans (1 ) => o^ x; + (y - dx) J] a, ■ J .t. y, 



^*«i 



"i > 



M 



i~\ 



Cl = 



i^j frrj _ * . (-1 



i»l 



M 



tf = 



Cov(X.Y) 
Var{x) 
Finalement : 



* 1 



f _ Cm'(.Y.K) 

b=\-ux 
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Remarque : On a une autre formule : 



a = ^ 



£(*,-*? 



/=l 



Lorsque deux variables sont en corrélation linéaire, alors on a : 
y = or +b est l'ajustement de y à partir de x. Cette droite s'appelle 
«droite de régression», on droite d' «estimation de y à partir de x ». 

Le procédé de détermination de l'équation de la droite de 
régression est généralement fondé sur le principe des moindres 

carrés. 

X = variable cause ; Y ■ variable conséquence 

D'après la méthode de moindres carrées : 



a = 



iiL— et b = v - ax 



lu-sr 



/=i 



Exemple : 



a 



351,60 fr = 30,4 -(1,1 17x26,1) = 1,25 



3 1 4.9 
Equation de régression : y = 1,1 17.V + 1.25 

Par analogie, on pourra chercher l'équation de la droite de 
régression de X par rapport à Y f équation de la forme x = a 'y + b' 
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Zk-vXv-y) 



avec 



amJ± 



— \2 



et b' = x-aj 



Z(y.-y) 



i-I 



Pour le même exemple on a : 



492,40 
Equation de régression de X par rapport à Y est : 



b'= 26,1 -(0,714x30,4) = 4,4 



x = 0,714 v + 4,4 



Remarque : 

On a: 



a=-^- 



Ife-ïXft-D iK-v,--Xv,-y) 



1 



Cor (.Y .K) 
ïfcrfjÉ] 

r_ IU,-.T)(y,-y) EU-rF 



fl VZU--^ ! Z(>-.-.v) 2 Z R - m - y) 

" vz(^-^z(y,-y) 2 " «awn 

--— T-r d OU r-4i— W 

» o(K) o(k) 

De même r = </' ; , 

ofO 

Exem P le : ( l'ajustement linaire par la droite des moindres carrées) 
Soit le tableau suivant ( déjà vu dans l'ajustement graphique 

linéaire) 
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*itf 



X; 



(^ -*îiîft-?) 



fe-no* - Ï3 



ï.yf -x 



rv 



15 



10 
13 
15 
20 

25 



42 



93 



14 

40 

?S 

120 

ISO 
ÏÇA 



m 



4 

t 

16 ; 
36 ! 

M 

■ 

85 ; 
169 



5 

_ a 

-1 

♦1 



-S.5 
-5.5 
-2.5 
1 -0.5 

12.5 



Wl 



41$ 

2S.5 
2.5 
-0.5 

3 



145 



2S 

9 
2 
1 
4 

36 



7g 



- * 2 -, 
X=- = 7 

6 6 



5>rft-5*2> 



fl = 



i^i 



y =^ = i5.5 



'" ! _ 



796-(l5,5x42) _ 796-651 145 
370 -(7x42) "370-294" 76 



« 1,908 



M M 

/> = v -oc = 15,5- (1,908x7) = 15,5- 11356 = 2,144 
Donc, l'équation de la droite d'ajustement sera: 



v = 1,908x +2,144 



*î 



1 

2S - 



24— ^ 
iO ■ 
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22 — 

3 — 



V « i.»OBx+ 2.144 
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i 1 ! i ! r i 
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Calcul du coefficient a en utilisant la formule : 



b = 2.144 
Remarque : 



145 

= — = i.ços 



Nous avons écrit dans la recherche du paramètre b 

1=) &[*-/&£] avec fU) «*%*i 
Vérifions ce résultat sur le calcul numérique qui vient d'être 

fait, et en prenant /(*) = i.QOBr 4- 1144 : 



% 




/(.y.) = l,9G8.r + 2-144 


» -#%) 


1 


^ 




* 1,04 


* 


10 


^—6 


* 0.224 


6 


13 


13,592 


- 0.592 


S 


15 


17,403 


- 24£S 


9 


20 


19,516 


-0,654 


13 


2S 


2É,$4S 


+ 1.0?2 


&,cog 



Ainsi la droite des moindres carrés: 
Minimise l( y. — f(x )) : 
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— _ %*V; 

- Passe par les points de coordonnées X — — - et 

tv 
f N 

- Rend nulle la somme algébrique des différences 
entre ordonnées réekkement observées, et ordonnées 
calculées à partir de la droite d'ajustement. 

Exercices 

Exercice n°l: 

Une distiribution statistique se présente fe la façon suivante : 

1) Représenter la graphiquement. 

2) Deux statisticiens différents ont abouti aux droites 
d'ajustement suivantes : 

- le premier : y = -2x + 27,2 

- le deuxième : y = -l,9x + 26 
En se fondant sur le principe des moindres carrés 
apprécier lequel des deux statisticiens a réalisé le 
meilleur ajustement. On calculera pour les deux 

fonctions obtenues le total ( y\ - y : ajustés) 2 est on comparera les 

résultats obtenus. 

3) Effectuer ensuite l'ajustement par la méthode des moindres 

carrés. 



X, 

• 


7i 


2 


21 


3 


22 


6 


15 


7 


14 


9 


10 


10 


8 


11 


4 


12 


2 
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4) Vérifier, à partir de l'équation de la droite des moindres carrés 
que le total ( \\ - y, ajustés) 2 est égal à zéro. 

5) Vérifier, à partir de cette même équation de la droite des 
moindres carrés que le total ( y. - y, ajustés) 2 est plus faible que 
chacun des deux totaux calculés en question 2). 

Exercice n°2 : 

Une entreprise commerciale consacre une certaine somme à 
des opérations publicitaires au début de chaque mois. 

Dans le tableau ci-dessous sont récapitulés, mensuellement 
pour 2008. 

Les sommes consacrées à ces opérations. 
- Les montants des ventes correspondantes. 



Mois 


Dépenses de publicités *. 
i en mïihorts de dirhams ; 


Ventes y; 

:en millions de 
dirhams) 




Janvier 


2,4 


3S 




Février 


3 


42 




Mars 


ï 


42 




Aj>ril 


2,5 


39 




Mai 


5.2 


40 




Juin 


3-? 


4? 




ï u J3efr 


^ 


3? 




Aoii.fr 


1.8 


24 




Septembre 


"• 
^ 


38 




Octobre 


Ï.2 


40 




Noveûture 


3.S 


44 




Décembre 


4.6 


53 
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On demande de: 

1) Calculer le coefficient de corrélation linéaire existant entre 

les deux variable x et y. 

2) Déterminer l'équation de la droite d'estimation de y à partir 
dex. 

Exercice n Q 3 : 

Un tableau statistique se présente comme suit : 

1) Calculer le coefficient de corrélation 
linéaire entre les variables x et y. 

2) Déterminer l'équation de la fonction 
de régression permettant d'estimer y à 
partir de la connaissance de x. 

3) Représenter graphiquement le nuage 
des points et de la fonction de régression. 



*i 


n 


-5 


33 


-1 


25 


3 


17 


10 


3 


13 


-3 
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Chapitre 7 : 

Séries Chronologiques 

L- Introduction: 

La prévision est un élément clé pour la prise de décision. 
Donc, prévoir l'évolution de l'environnement économique à 
travers tous les facteurs qui peuvent exercer une influence sur le 
résultat est une étape primordiale qui précède la prise de 
décision. Ce qui suppose une précision de la situation économique 
une fois que les choix auront été effectués, c'est enfin contrôler, 
c'est-à-dire comparer les résultats obtenus avec ceux qui étaient 
prévus. 

Le plus souvent les données utilisées dans le domaine de la 
prévision proviennent des séries chronologiques. C'est donc par 
l'étude de ce type de données que convient d'aborder l'analyse 
des méthodes de prévision. 

Définition: 

Une série chronologique ou temporelle est une suite 
d'observations d'un phénomène au cours du temps. 
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Exemple: 

La statistique des ventes mensuelles d'un certain produit constitue 
une série chronologique, de même que l'évolution annuelle du 
niveau général de prix ou encore du taux d'équipement des 
ménages en machines à laver. 

L'état du phénomène est repéré à intervalles réguliers selon une 
périodicité qui peut être très différente d'un problème à un autre 
qui dépend des possibilités d'enregistrement, mais aussi de 
préoccupations opérationnelles. 

Toute entreprise peut avoir facilement accès à un grand nombre 
des séries intéressantes, soit d'origine interne (statistiques de 
production, de commandes, de livraisons ou encore de trésorerie), 
soit d'origine externe (statistiques de syndicats professionnels, de 
la direction nationale des statistiques). Mais ces données ne sont 
généralement pas utilisables dans leur état. 

La formalisation puis le traitement des séries chronologiques sont 
deux étapes préalables à leur utilisation en matière de prévision 
ou de contrôle- 
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IL- Formalisation des séries chronologiques : 

Toute série chronologique apparaît comme le résultat de plusieurs 
mouvements élémentaires qui se superposent. 

Un modèle de série chronologique devra mettre en évidence 
quelles sont ces composantes et quelles sont ses règles de 
composition. 

1.- Composantes des séries chronologiques: 

L'évolution d'un phénomène au cours du temps est généralement 
déterminée par le mouvement de quatre composantes 
élémentaires : 

• La tendance Tt 

• La conjoncture Ct 

• La saison St 

» Le résidu Rt 

a.-La tendance (Trend): elle représente l'évolution moyenne à long 
terme du phénomène étudié (on l'ajuste par une droite en 
général). 
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b.-La conjoncture (cycle): c'est un facteur qui joue à moyen terme 
et qui se manifeste par des mouvements cycliques faisant alterner, 
sur plusieurs années, des phases d'expansion ou de récession. 

c.-La saison (composante saisonnière); elle se rapporte à des 
fluctuations de périodicité constante égale au plus à l'année, dont 
les causes sont diverses (traditions, congés, fêtes, saisons, 
vacances, météorologie...) (court terme) , 

d.-Le résidu {facteur résiduel): il recouvre un ensemble hétérogène 
d'éléments que l'on regroupera en deux catégories selon qu'ils 
introduisent des perturbations identifiables et donc éliminables ou 
au contraire aléatoires . C'est une composante accidentelle ou 
imprévisible dépendante du hasard et de l'aléatoire (Innovations 
technologiques imprévues, catastrophes naturelles, grève, ...) 

2.- L'analyse graphique des composantes: 

Une série chronologique se définit comme la succession des 
valeurs d'une variable ordonnées par un indicateur de temps. Elle 
se représente généralement sous la forme d'un graphe tel que le 
suivant : 
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Evolution des ventes mensuelles d'un certain 

produit 




-i r— »-■ 1 , 

1 2 3 4 5 G 7 8 9 10 11 12 13 14 15 1$ 



L'analyse des séries chronologiques considère la décomposition en 
quatre types de variations: la tendance, la conjoncture, la saison, et 
le résidu. 



Le schéma suivant illustre cette décomposition : 



Evolution des ventes mensuelles d'un produit 



200 
150 
100 

(A 

iso 

4> 





-50 

-100 



"*■/ 



— f-f - 



i-*U 






— i_^ ■■ -/ . ; 



*-m 



— ---Saison 



tendance 



Conjonctuie 
■"*■*« Résidus 
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3,- Rèple de composition des séries chronologiques: 

la valeur observée à la date t de la variable étudiée Yt, est 
fonction des valeurs prises à cette même date par les diverses 
composantes : 

Yt=/(Tt,a,St,Rt) 

Deux schémas de composition principaux sont utilisés ; 

• le modèle additif, 

• et le modèle multiplicatif. 

> Dans le modèle additif, la valeur Yt est la somme des 
valeurs prises par les différentes composantes: 

Yt = Tt + Ct + St + Rt 

où St=St+m si le cycle saisonnière porte sur m 
périodes. 

Dans ce modèle, 

3 Chaque élément est mesuré dans la même unité que Yt. 

O Si la variation saisonnière manifeste une périodicité de m 
périodes alors: V$fsO : dans la mesure où la tendance 



/=r-l 
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représente la moyenne du phénomène, il faut que les 
variations saisonnières amenant Yt au dessus de la 
tendance soient compensées par des variations d'amplitude 
équivalente au dessous. 

O De façon plus générale, et pour la même raison, si la 
tendance a été correctement calculée, l'effet moyen à long 
terme de chacun de ces éléments C, S et R doit être nul. 

Remarque: 

Dans le modèle additif, l'effet d'une variation de l'une des 
composantes sur Yt est indépendant de la valeur prise par les 
autres composantes. 

> Dans le Modèle multiplicatif, Yt apparaît comme le produit 
des différentes composantes : 

Yt = Tt.Ct.St.Rt, 

où Yt est mesuré en unités (dhs, tonnes, etc..) de même que la 
tendance ; les autres facteurs sont intégrés dans le modèle sous la 
forme de coefficients multiplicateurs de type St = (1+st), où st est 

le pourcentage de variation due à la saison, par exemple. 

Le modèle multiplicatif peut être traduit sous forme additif 
si l'on utilise des logarithmes avec: 
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Log Yt = Log Tt * Log Ct + Log St + Log Rt 

Dans la mesure où les fluctuations saisonnières doivent se 
compenser sur m périodes dans le modèle additif, il faut que 



i+m 



TLogSt^Q, 



!=..! 



ce que revient à dire, puisque ^Log(St)= Log(J[\St) que le 
produit des coefficients saisonniers doit être égal à 1. En fait, la 

condition ]~[& = 1, sera souvent approchée par la condition 

i+m 



i=t-\ 



En effet, quand « si » est petit, 

on peut approcher Log {Si} = Log (l + ri) par si. 

Dans ce cas, £ Lo 8 (&") est équivalent à ^si . 

La condition ^Log(Si)~0 devient alors £(l + si) = /w. 

Dans le modèle multiplicatif, les composantes ne sont plus 
indépendantes. L'effet saisonnier sera d'autant plus important en 
valeur absolue, que la tendance et la conjoncture seront élevées. 



131 «ETUUP 

.corn 



Statistique Descriptive Séries Chronologiques 

À priori, aucun de ces deux modèles ne doit être déclaré supérieur 
à l'autre: il convient de les tester sur les données afin de repérer 
celui qui reproduit le mieux le phénomène considéré. Il faut noter 
également que des formulations mixtes peuvent être utilisées, 
comprenant une partie additive et une partie multiplicative. 

III.- Traitement des séries chronologiques: 

Traiter une série chronologique consiste à mettre en évidence 
ces différentes composantes à l'aide d'une procédure de 
décomposition donnée. 

La technique la plus courante fait appel aux moyens mobiles 
pour dégager l'évolution à moyen terme du phénomène, c'est-à- 
dire la combinaison de T et de C (c'est-à-dire de minimiser les 
fluctuations aléatoires). Une fois cette opération réalisée, il devient 
possible de déterminer la valeur des coefficients saisonniers, de 
même que la composante résiduelle. 

1,- La méthode des moyennes mobiles: 

Étant donné un ensemble d'observations correspondantes à 
une série chronologique, la détermination des moyennes mobiles 
d'amplitude « h » se fait de la façon suivante: 
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i. On forme des groupes de « h » observations et on 
calcul leurs moyenne. 

ii. Le premier groupe est formé par les « h » premières 
observations. 

iii. Les groupes suivants seront formés en excluant du 
groupe antérieur la première observation et en 
incluant la postérieure (observation) dans le groupe 
suivant. 

iv. On continue le processus jusqu'à ce qu'on ne peut 
plus former des groupes 

Les moyennes obtenues dans le processus antérieur s'appellent 
moyennes mobiles d'amplitude ou d'ordre « h ». 

Chaque moyenne mobile sera associée au point du milieu 
de l'intervalle de temps sur lequel elle a été calculée. 



Nous allons voir ça pour h=3 



Données 



a 



a 



Ytl 



Yt2 



Somme des 

groupes de trois 

observations 



Ytl+Yt2+Yt3 



Moyennes mobiles 



d'ordre 3 



Y2=l/3[Yt1+Yt2+Yt3] 
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t3 


Yt3 


Yt2+Yt3+Yt4 


Y3=l/3[Yt2+Yt3+Yt4] 


t4 


Yt4 


Yt3+Yt4+Yt5 


Y4=l/3[Yt3+Yt4+Yt5J 


tn-2 


Ytn-2 


i i • 

Ytn-3+Ytn-2+Ytn-1 


Tn-2=l/3[Ytn-3+Ytn-2+ Ytn-1] 


tn-1 


Ytn-1 


Ytn-2+ Ytn-1 +Ytn 


Tn-l-l/3[Ytn-2+Ytn-l+Ytn] 


tn 


Yhi 









de moyennes mobiles (pour la première et la dernière 
observations du tableau précédent), par.conséquent dans les 
calculs postérieurs des moyennes mobiles on aura moins de 
données que dans les "n" de départ. 

La méthode des moyens mobiles repose sur le prfncipe suivant: 
Les variations saisonnières disparaissent pratiquement lorsqu'on 
remplace les valeurs observées de la série par des moyennes 
calculées sur une période suffisamment longue (3 mois, 4 mois, 5 
mots,..., ou 12 mois). 

La période doit être choisie en fonction de la périodicité des 
résultats: s'il s'agît de variations saisonnières sur une année, la 
période est 12 mois, 4 trimestres ou 3 quadrimestres... 

La méthode des moyennes mobiles est une méthode de lissage, 
c'est-à-dire qu'elle atténue les variations d'une série 
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chronologique. Comme telle, elle peut être employée pour lisser 
une série, que celle-ci présente ou non des variations saisonnières. 
Les moyennes mobiles que nous avons considéré sont des 
moyennes avec des pondérations égales pour chacune des 
observations (parfois on les appelle non-pondérées), il est possible 
aussi de considérer un ensemble de pondérations associées. 

Il existe ainsi des moyennes mobiles pondérées, dans lesquelles on 
donne, en général, un poids plus important aux observations 
centrales, et moins important aux observations plus éloignées du 
centre. 

Si le nombre des observations choisies pour les moyennes mobiles 
est pair, il sera nécessaire de les centraliser dans les mêmes 
instants de temps où se situent les observations initiales. 

Le tableau suivant expose les opérations nécessaires pour /i=4. 



Données 


Som me des 
groupes de 4 
observa Lions 


Moyennes 

mobiles d'ordre 

4 


Moyenne mobiles 
centrées 


t; 


Yn 








t : 


Ytz 








h 


Yr. 


XV, 


~ = J/JIY,, 


Ys~V2reis*Yi3} 


u 


Yh 


D"„ 


Ysfl/fLYii 


Y<=1/>/Yï.5* Y*sJ 


h 


Yb 


YY„ 


T5-WŒYÏ 


Yj-Ï/2IYas* YwJ 
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tv 



Y 



N> 



ZYi 



ft^WCYi 



Y P -ï/2/Y 5 .5* Y„ 5 J 



Centrer des moyennes mobiles d'ordre pair est équivalent à 
calculer des moyennes mobiles pondérées d'ordre impair. 
En effet, vérifions cette affirmation sur le tableau précédent: 



H< F => + ^ï(i|>^F'<) 



=j\j(Vt 1 +2Y h + 2rt i +2Yt 4 +Yt $ ) 

Comme on peut remarquer, la moyenne mobile centrée d'ordre 4 
(Y3) calculée pour l'instant fe, est la moyenne mobile pondérée 
d'ordre 5 où les valeurs extrêmes ont un poids égal à la moitié du 
poids correspondant aux valeurs centrales. 

De même, on le peut vérifier pour n'importe quel autre instant tj. 
Exemple: 

Calculer les moyennes mobiles d'amplitude 3 et d'amplitude 4 
pour les données suivantes : 



/ 


Yt 


h=3 


ii=4 


1970 
1971 


1 
3 


6 


2 
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1972 


2 


5 


1,66 


6 


1,5 




1973 





4 


1,33 


7 


1,75 


1,625 


1974 




a- 


6 


2 


8 


2 


1,875 


1975 


4 


7 


2,33 


7 


1,75 


1,875 


1976 


1 


6 


2 


8 


2 


1,875 


1977 


1 













Sur les colonnes h=3 et h=4, vient en premier lieu la colonne des 
sommes mobiles et à la suite les moyennes mobiles. 

Étant donné que chaque moyenne mobile est associée au milieu de 
l'intervalle de temps sur lequel elle a été calculée, les moyens 
d'ordre trois se fixent dans le deuxième des trois années sur 
lesquelles elles ont été calculées. 



4_5 ............ .............,.,..--.........,..-.^..^- : - : ■-■■:■ ■■■; ■.•■....-..:—■■■--•■.•■-- Y/;"/' 




Sériel 



1970 1971 1972 1973 1974 1975 1976 1977 



La méthode des moyennes mobiles a deux inconvénients: 
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premièrement elle ne donne pas de moyennes mobiles pour le 
premier et le dernier groupe de périodes de la série. Au cas où la 
série chronologique serait composée d'un nombre limité 
d'observations, les valeurs omises peuvent représenter une 
importante perte d'information. 



2,5 
2 

1,5 
1 

0,5 




-~- 




Moyennes mobiles d'ordre 3 




Moyennes mobiles 

I' " ' i 



y 



— 



___ 



1970 1971 1972 1973 1974 1975 



2.5 
2 

1.5 
1 
0.5 



moyennes mobiles d'ordre 4 




1970 



moyennes mobiles 
d'ordre 4 



1971 



1972 



1973 
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Deuxièment, les moyennes mobiles "négligent" la plupart des 
valeurs précédentes de la série chronologique. 

Ces deux inconvénients sont redressés par la méthode de lissage 
exponentielle 

2.- Méthode de lissage exponentielle: 

La méthode exponentielle de lissage d'une série chronologique est 
définie de la façon suivante : A' ; =er/ + (l- e)X,_, pour t > 2 . 

Où X, est la série chronologique lissée exponentiellement à la 
date t. 

Yt est la série chronologique à la date t 
X,_ ( est la série chronologique lissée exponentiellement à la 
date t-1 

9 est le coefficient de lissage ;avec O<0<! 
On commence par poser: 

Ce qui donne X 2 = 0K, +(l - Q)X t 

= er : -f-(i-e)r l 

v ; =e>\ + 0-e)x> 

= er 5 + (i-8)(9K ; +(i-e)K I ) 

= e>' l +(i-e)B>'' : +(i-e)'K 
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x 4 =er 4 + (i-e)A-, 

= e ï a + (j - e)(ey, + (i - e)er : + d - e) : y, ) 

=eK 4+ (i-0)eK, + (i-e) : e)' 2 +(i-e) , r 1 

En générale, on obtient: 

.v,=eK+(!-e)er,_ 1 +(i-e)- , eK,_ 2+ ... + (i-e)'- | K l 

Cette dernière formule indique qu'une série chronologique 
« lissée » à la date t, dépend de toutes les observations antérieures 
de la série. 

Le coefficient de lissage 9 est choisi en fonction du degré de 

lissage demandé. Une valeur de 6 tendent vers (zéro) produit 

un degré de lissage assez important. Par contre, une valeur 

6 proche de 1 résulte un lissage assez limité de la série en 
question. 

- 

Exemple: 

Pour pouvoir élaborer un système de prévision des ventes 
de sa filiale, une firme multinationale a relevé, pendant une 
période de 4 semaines, les ventes quotidiennes de la filiale en 
question. 

Les résultats de ce suivie sont regroupés dans le tableau suivant: 
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Jours 






\ j 
i\ 


1 


*) 


3 


4 


5 




en 
5 

S 

i 

s 


î 


33 


45 


25 


12 


30 




2 


41 


41 


40 


9 


24 




3 


30 


57 


33 


20 


36 




4 


54 


58 


36 


25 


40 





Transformons d'abord Y 9 en Yt et appliquons la méthode de 
lissage exponentielle avec 6 = 0,25 et 9 = 0,75 et représentons 
graphiquement les résultats. 





Dates t 


Yt 


Xt 

(teta=0,25) 


Xt(teta=0,75) 


SI 


1 


33 


33 


33 


2 


45 


36 


42 


3 


25 


33,25 


29,25 


4 


12 


27,9375 


16,3125 


5 


30 


28,453125 


26,578125 


S2 


6 


41 


31 ,58984375 


37,39453125 


7 


41 


33,94238281 


40,09863281 


8 


40 


35,45678711 


40,0246582 


9 


9 


28,84259033 


16,75616455 
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10 


24 


27,63194275 


22,18904114 


S3 


11 


30 


28,22395706 


28,04726028 


12 


57 


35,4179678 


49,761 81 507 


13 


33 


34,81347585 


37,19045377 


14 


20 


31,11010689 


24,29761 344 


15 


36 


32,33258016 


33,07440336 


S4 


16 


54 


37,74943512 


48,76860084 


17 


58 


42,81207634 


55,69215021 


18 


36 


41,10905726 


40,92303755 


19 


25 


37,08179294 


28,98075939 


20 


40 


37,81134471 


37,24518985 



Représentation graphique: 




o - 






X«WU-0.25) 
Xl0eia-0,75i 



— . ■mv/;..;^. ', ._ 



1 2 3 4 * 6 7 8 9 10 11 12 13 14 15 16 17 18 19 30 
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Remarque: 

Les moyennes mobiles et la méthode exponentielle sont des 
méthodes relativement assez limitées de réduction ou 
d'élimination des fluctuations aléatoires dans le but de découvrir 
l'existence d'autres composantes. 
3.- Détermination de la variation saisonnière: 

Les fluctuations saisonnières correspondent à des variations 
qui peuvent avoir lieu durant une année ou même sur un 
intervalle de temps plus court: mois, semaine, jour. Dans le but de 
mesurer l'effet saisonnier, nous allons construire des indices ou 
coefficients saisonniers, qui ont pour objet de mesurer le degré de 
différence entre les saisons. 

Une condition nécessaire pour l'étude de la composante 
saisonnière est qu'on ait une série chronologique suffisamment 
longue pour qu'on puisse observer l'existence de saisons. 
Les indices saisonniers sont calculés de la fa<;on suivante: 

L Extraire l'effet des fluctuations saisonnières en calculant les 

moyennes mobiles. Si on utilise par exemple un modèle 

multiplicatif de série chronologique, on aura: 

Yi=TtxCtxSi*Rt 

Les moyennes mobiles éliminent Si et Ri. 
2. Calculer le rapport de la série sur la moyenne mobile. On 

obtient: 
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Y 

— = S f xtf, 

T,xC, ' ' 

Le résultat obtenu est une mesure de là variation saisonnière et 
aléatoire, 

3. Pour chaque type de saison, calculer la moyenne des 
rapports obtenus au 2 ènw point. Cette procédure extrait ou 
élimine la majorité de la variation saisonnière. Cette 
moyenne est au fait une mesure des différences 
saisonnières. 

4. Les indices saisonniers sont les rapports moyens obtenus au 
3 èm * point ajustés pour s'assurer que 3'indice saisonnier 
moyen est égal à l'unité. 

Exemple: 

Le nombre de visiteurs d'une grande galerie d'exposition 
pendant les trois dernières années est consigné dans le tableau 
suivant: 
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Trimestres 




i 


i 


1 2 


3 


4 


1 


1 

2 
3 


10 


9 


12 


15,5 


14 


14 


18 


21 


22 


21,5 


25 


30 



pouvoir mesurer le volume de variation saisonnière. 



Dates t 


Yt 


M.M. d'ordre 4 


M.M.C. d'ordre 4 


YI/MMC4 


1 


10 








2 


9 








3 


12 


11,625 


12,125 


0,989690722 


4 


16 


12,625 


13,25 


1,169811321 


5 


14 


13,875 


14,625 


0,957264957 


6 


14 


15,375 


16,0625 


0,871595331 


7 


18 


16,75 


17,75 


1,014084507 


8 


21 


18,75 


19,6875 


1,066666667 


9 


22 


20,625 


21,5 


1,023255814 


10 


22 


22,375 


23,5 


0,914893617 


11 


25 


24,625 






12[ 30 









Si l'on regroupe les rapports par trimestre, nous pouvons 
constater les similarités pour chaque type de trimestre et les 
différences entre les différentes types de trimestres. 
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Une fois, les données sont groupées par trimestre, on calculera la 
moyenne des valeurs pour chaque trimestre, pour éliminer ou 
épurer la variation aléatoire. 

La dernière étape consiste à ajuster les moyennes en divisant 
chacune d'elles par la somme des quatres moyennes et en 
multipliant par 4 (nombre de trimestres par an), on obtiendra alors 
les indices saisonniers. 



^\Tr i mestres 
Années^ s \ v ^ 


1 


2 


3 


4 


Total 


1 






0,99 


1,17 




2 


0,957 


0,872 


1,014 


1,067 




3 


1,023 


0,915 








Moyennes 


0,99 


0,893 


1,002 


1,118 


4,004 


Coefficient 

Saisonnier 
(S,) 


0,989 


0,893 


1,001 


1,117 


4 



Les indices saisonniers indiquent qu'en moyenne, le nombre de 
visiteurs de la galerie des l" r et 2 è ™ trimestre sont inférieures à la 
moyenne annuelle, alors que le nombre de visiteurs pendant le 
4* mtf trimestre dépasse la moyenne annuelle. 
Représentation graphique des indices saisonniers: 
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4.-Détermination de la variation résiduelle: 

Une fois les coefficients saisonniers, Si, déterminés, l'évolution des 
variations résiduelles s'effectue en prenant le rapport des 
combinaisons (St.Rt) à St. C'est ce à quoi on a procédé dans le 
tableau suivant: 



^\Trimestres 
Années ^\^^ 


1 


2 


3 


4 


1 






0,989 


1,047 


2 


0,968 


0,976 


1,013 


0,955 


3 


1,034 


1,025 
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Exercices 



Exercice n°l: 



On considère les ventes trimestrielles d'un produit depuis 4 
ans (Ventes en milliers d'unités) : 



Trimestres 


1 


2 


3 


« 


Ventes première année 


150 


80 


110 


205 


Ventes deuxième année 


170 


95 


125 


215 


Ventes troisième année 


180 


105 


115 


240 


Ventes quatrième année 


195 


110 


150 


255 



1 Calculer les moyennes mobiles de longueur 4. 

2. Représenter graphiquement les ventes trimestrielles et 
les moyennes mobiles (sur le même graphique). Qu'est 
ce que vous remarquez ? 

3. Calculer les indices saisonniers pour chaque trimestre. 

4. Déterminer la variation résiduelle. 

5. Appliquer la méthode exponentielle de lissage avec 
0=0,75 et représenter graphiquement les résultats. 
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Pour pouvoir élaborer un système de prévision des ventes 
de sa filiale, une firme multinationale a relevé pendant une 
période de 4 ans, les ventes trimestrielles de la filiale en question. 

Les résultats de suivie sont regroupés dans le tableau 
suivant : 









Trimestres 






1 


2 


3 


4 




1 


33 


45 


25 


12 


m 
<4J 


2 


41 


41 


40 


9 


c 

c 

< 


3 


30 


57 


33 


20 




4 


54 


58 


36 


25 



1. Calculer les moyennes mobiles de longueur 4. 

2. Représenter graphiquement les ventes trimestrielles et les 
moyennes mobiles (sur le même graphique). Qu'est ce que 

vous remarquez ? 

3. Calculer les moyennes mobiles centrées de longueur 4. 

4. Calculer les indices saisonniers pour chaque trimestre. 
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5. Déterminer la variation résiduelle. 

6. Appliquer la méthode exponentielle de lissage avec 6=0,75 
et représenter graphiquement les résultats, 

7. La direction de l'entreprise estime que la tendance des 
ventes de sa filiale est linéaire. Analyser la tendance de ces 
ventes en utilisant la méthode des moindres carrée. 

8. Étudier la qualité de cette représentation en calculant le 
coefficient de corrélation. Conclure. 
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itre8i 

Les nombres indices 

I- Introduction et définition : 

On désigne par indice la grandeur statistique avec laquelle on 
mesure les variations dans le temps d'une variable ou d'un 
ensemble de variables dépendantes. On appelle tableaux 
d'indices, l'ensemble des indices correspondant à plusieurs 
années, plusieurs localités, etc.. 

A l'aide des indices on pourra, par exemple, comparer le coût 
de la vie dans une ville, durant une certaine année, avec celui des 
années précédentes, ou, par exemple, la production annuelle 
d'acier d'un pays avec celle d'un autre pays... etc. Les indices 
trouvent leurs applications dans de nombreux domaines : les 
affaires, l'économie, l'éducation la sociologie, ...etc. 

C'est pourquoi de nombreux organismes gouvernementaux et 
privés sont engagés dans le calcul des indices. Afin de prévoir les 
affaires et les conjonctures économiques. Ces organismes 
rassemblent sans cesse des informations d'ordre général. On 
distingue ainsi l'indice des salaires, de la production, du 
chômage, des naissances, ... etc. 

Le plus connu, peut être le plus exploité, est celui du coût de la 
vie ou indice des prix à la consommation, mis au point par le 
«Bureau of Labor Statistics». Au Maroc, les indices et les 
indicateurs économiques sont établis par la «Direction de la 
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Statistique » (côté public) et par le « Centre Marocain de 
Conjoncture (CMC) », (côté privé). 

Il existe deux catégories d'indices : les premiers se réfèrent 
à des grandeurs simples et les secondes correspondent à des 
grandeurs complexes. 

II- Indices simples : 

1- Définition : 

1 

Les grandeurs étudiées (économiques, sociales, 
culturelles...) prennent des valeurs variables au cours du temps 
ou dans l'espace. En comparant ces différentes valeurs en terme 
de rapport on obtient un indice.simple ou élémentaire. 
Exemple : 

Soit P le prix d'un certain livre en une date foet soit Pj le prix du 

même livre en une deuxième date tj. 

Soit Po=50 DH et P 7 = 60 DR 

Pour évaluer la variation du prix du livre, on peut dire qu'elle est 
de: 

• Pi - Po= 60 -50=10 DH, soit une augmentation de 
±gxl00=20%. 

• 5Q = ' - 20 c 'est-à-dire que le prix a été multiplié par 1,2. 

• (1,20)X100=120^ valeur lOOenfo 

=> valeur 120 en ti 
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të^xlOO] représente un indice de prix. 

Lorsque l'indice porte sur une seule grandeur, on l'appelle indice 
simple ou élémentaire, il se note d'une manière générale : 
Indice des prix : 

7rtî=-fl-xl00 avec flest le prix en une date f 

/T) 

et F) le prix de référence. 

Indice de valeur : 

/, = ¥lx\ 00 avec Y est la valeur en une date t 

Va 

et Mi la valeur de référence. 

Ces indices sont exprimés en pourcentage et n'ont pas de 
dimension et servent par conséquent à comparer des valeurs 
différentes, qui ont des unités différentes. Ils ne sont pas toujours 
liés au temps mais peuvent être par rapport à l'espace (La ville, le 
pays, le lieu...) En utilisant le temps, la période de référence (0) 
s'appelle la période de base. 

Exemple : 

Supposons que le prix d'achat d'un litre de lait ait été 1,20 DH en 

1%5 et 2,O0DH en 1985. 

En prenant comme année de base 1965, on a : 

/ m5lw= ^_xl 00=166% 
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Ce qui signifie que le prix du lait a été en 1985, 166% celui de 

1965, ou a augmenté de 66% de 1965 à 1985. 

En prenant comme année de référence 1985, on a: 

/IOR5I965 =-^xl 00=60% 

Ce qui signifie que le prix du lait a été en 1965, 60% fois celui de 
1985, ou a diminué de 40% entre 1985 et 1965. 
Remarque : 

Pour alléger l'écriture aussi bien que les quelques démonstrations 
qui vont suivre, nous noterons l'indice sous 3a forme : 




en omettant le facteur multiplicatif 100 
2- Propriétés des indices élémentaires : 

Les indices sont souvent l'objet de modifications; ces 

modifications sont possibles grâce aux propriétés que vérifient ces 

indices. 

a- Identité : 

L'indice correspondant à une même période donnée par rapport à 
la même période est de 100%, 

/<hi = /o = 100% 

i 

b- Circularité : 

Les indices élémentaires peuvent changer d'année de base par la 
règle de circularité: 
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On déduit 



It/0 = If/s ' Is/O 



Cette propriété permet de comparer, non seulement les périodes 
et t d'une part et et s d'autre part, mais aussi t et s. 




La comparaison se fait indépendamment du choix de la période 
de référence 0. 

Exemple: 

On a noté les informations suivantes concernant le prix d'un 

paquet de café moulu 250g, marque « X » dans une ville « Y » : 



Epoques 


Prix paquet 


Indices 




de 250g (en DH) 


Année de base 1998 


1998 


11 


100 


1999 


12,65 


115 


2000 


15,18 


138 



Supposons que l'on veuille changer de base, en prenant (1999) 
pour période de base. 

• Par application de la définition, on a : 

/:(Wi99 9 =J44l xl0O=120 
12,65 

• Par application de la propriété de circularité, on a : 

/20WH99» = /:OOQ-|*WX /|9W998 



alors 



/ 20001999 = 



I200jyig98 

Il 094 (998 
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et on le multiplie par 100 pour l'exprimer en pourcentage, on 
obtient : 

1199^1998 1 15 



o Réversibilité : 



On a: 



Ou bien 



I 



Po Po/Pr 



1 c'est-à-dire 




/,/0 •/()//=! 



Cette propriété est intéressante surtout lorsque Ton se réfère à un 
critère qui n'est plus le temps. Par exemple, si on compare le prix 
d'un produit au Maroc au prix du même produit en Espagne, on 



aura : 



I Maroc /Espagne — 



1 



/ Espagne /Maroc 
d- Transférabilité ; 

La 2 ème propriété entraînée par la circularité de l'indice simple est 
la transférabilité de l'indice. On aura : 



L/0=It/i-] ' It-l/t-2 • h-ï/t-l . . . I]/o 



Ceci signifie que l'on obtient l'indice de la date t par rapport à 
en faisant le produit des indices intermédiaires d'une date par 
rapport à l'autre. 
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III- Indices composés r 

1- Définition : 

Les grandeurs que l'on étudie, le plus souvent, sont des 
grandeurs composées d'un grand nombre d'éléments mesurés par 
des grandeurs simples. Alors, l'indice qui synthétise plusieurs 
indices simples s'appelle indice composé ou synthétique. 

2- Emploi des moyennes : 

Comme il faut aboutir à un indice unique résumant une 
grande quantité d'informations, on peut faire appel au calcul des 
moyennes pour construire ces indices. 

Deux possibilités se présentent : soit on considère l'indice 
des moyennes, soit la moyenne des indices. 

a- Indice des moyennes arithmétiques pondérées : 

On note par *HU le prix d'un certain produit « / » à la 

date t et on note 8w la quantité consommée de ce produit 

« i ». 

Supposons que l'on veut calculer l'indice synthétique des 
prix de « k » produit (;=l,2,...,fc) à la date / , en prenant la 

date comme base. 

Alors l'indice des moyennes arithmétiques pondérées est 



/ k 



£fi<OW)/£fi(0 

I„ v = ig Uzl x 1 00 

£ô(/)Po(o/£ôO') 

r«1 / m\ 



157 4ETIHJP 

.corn 



Statistique Descriptive 



Les nombres indices 



où on a considéré les quantités Q(i) comme coefficients de 

pondérations. 

Les pondérations sont nécessaires puisque les produits 

composant l'indice ne doivent pas être affectés de la même 

mesure (par exemple, le pain dans l'indice général des prix à un 

poids plus important que la mayonnaise !). 

b- Moyenne arithmétique pondérée des indices simples : 
Dans ce cas, on détermine d'abord l'indice simple propre pour 
chaque produit « î », et ensuite, on fait la moyenne arithmétique 
pondérée des indices simples affectés à leur pondération. 
Alors la moyenne arithmétique pondérée des indices simples est : 



ftfi" 


_ /=] /MO . 


<100 





Exemple : 

Soient "(0 les prix de quatre produits /=1 ,2,3,4 à une date t 

et soient Q(i) ; 1=1 ,2,3,4 leurs quantités consommées. 



Produits 


Prix unitaires (en DH) 


Quantités 

QU) 


tm 


B{î) 


1 


10 


14 


4 


2 


12 


13 


5 


3 


15 


15 


3 


4 


3 


5 


8 
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- Calculons l'indice des moyennes arithmétiques 
pondérées ( date de référence étant 0) : 

^ (4xl4H(5xl3)+(3xl5)4-(8x5)/4+5+3+8 inf) 
fi ~ (4x10 H(5xl2 )+(3Xl5 )+(8x3)/4+5+3+8 

Le résultat signifie qu'on dépense 121,90 DH en t pour se 
procurer les mêmes quantités de produits qui coûtaient 100 DH 
en date de base; c'est-à-dire que l'augmentation entre ces deux 

dates a été de 21,9%. 

- Calculons la moyenne arithmétique pondérée des indices 

simples (date de base étant 0) : 

/*= 10 a ] î iJ 5 2 - xl0 ° = on Xl0 ° 

4 + J + J + ÎS — U 

donc 

/ 1/(1 =27_^5_ xl0 O =136 ,75 

Remarque : 

Dans les deux indices précédents, on a supposé que les 
quantités consommées soient les mêmes en date t qu'en date de 
base; alors que les quantités consommées peuvent-elles aussi 
varier entre ces deux dates. 
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1- Indices de Laspevres (1834 - 1913) : 

Pour Laspeyres, les pondérations s'effectuent pour la 
période de base. En distinguant les deux cas précédents, on 
obtient les indices suivants ; 

• Cas de l'indice des moyennes arithmétiques pondérées : 



î<2o(/)/U/) 
L.,0 = 4g xl 00 

2>(«)ft(0 



i=l 



Cas des moyennes arithmétiques pondérées des indices 
simples : 




• Si on considère l'indice des prix, alors c'est le rapport des 
dépenses totales où seuls les prix sont variables. 

• Si on considère l'indice des quantités, alors c'est le rapport 
des dépenses totales où seules les quantités sont variables. 

2- Indices de Paasche (1851 - 1925) : 
Dans ce cas, les pondérations se font pour la période considérée £ 
Deux cas se distinguent : 

• Cas de l'indice des moyennes arithmétiques pond. 



lerees : 
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Cas des moyennes arithmétiques pondérées des indices 
simples : 




Tableau récapitulatif: 



Indices 


Laspeyres L 


Paasche P 


PrixP 


<-§>» 


fl HS£* ,o ° 


Quantités Q 


^gê™ 


ft =Hx' M 


Valeurs globales 


L "= fl -=£i^< 100 



Exemple : 

Quatre produits j=l, 2, 3, 4 sont donnés avec prix Pif et quantités 
Qa en des dates ï-0, t 



Produits; 


Date de base 


Datef 


P«i 


Q» 


Pti 


Q« 


1 

2 


12 

5 


6 
13 


15 
8 


7 
11 
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3 

4 


15 
8 


9 
10 


13 
10 


18 
9 



Calculer les indices de Laspeyres et Paasche correspondants aux 
prix, aux quantités et aux valeurs globales : 



Produits 


PoQo 


PtQt 


PoQ, 


P,Q° 


1 


72 


105 


84 


90 


2 


65 


88 


55 


104 


3 


135 


234 


270 


117 


4 


80 


90 


72 


100 


Totale £ 


352 


517 


481 


411 



L " = |i^ Xl00= 352 X,00= = 116 ' 76 






tes = ^T„x l 00=512x1 00 = 1 46,86 



ftHpSwal 00=4Sxl 00 « 1 07,48 






481 



xl00=4tr x l 00=1 25.79 
411 



#< = J^-xl 00=|i?xl 00= 1 46,86 

Remarque : 



îoo ' îoo -**-^ 
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Pour l'exemple précédent 

(116J6)(I25.79) _ (136,65)(107 ? 48) _ 1 ^ R7 
M " 100 ■ ' 

3- Indices de Fisher : 

Le fait de considérer fa même quantité consommée pour 
les deux dates n'est pas satisfaisant. On peut remédier 
partiellement à cet inconvénient en considérant un autre indice 
qui est l'indice de Fischer. Il est donné par la moyenne 
géométrique des indices de Laspeyres et de Paasche : 

Fp=^LpPp (p r i x ) 

/e=^/Ze/è (Quantités) 

4- Propriétés des indices composés : 

• L'indice des moyennes arithmétiques pondérées des 
différentes époques est réversible et transférable (à la 
condition que la pondération ne change pas d'une période 
à l'autre). 

• L'indice composé, moyenne arithmétique pondérée des 
indices simples n'est généralement ni réversible, ni 
transférable. 

• Aucun des trois indices (de Laspeyres, de Paasche, de 
Fisher) ne possède la propriété de circularité. 

• L'indice de Fisher est réversible. 
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IV- Les indices dans la vie économique : 

Il est de plus en plus nécessaire, pour gérer les affaires d'un pays, de 
connaître, à lout moment, la situation économique de celui-ci. 
Toute évolution doit être suivie avec régularité d'où la nécessité de 
calculer des indices analogues à ceux que nous avons introduits dans ce 
chapitre. 

Au Maroc, La Direction de la Statistique mène des 
enquêtes périodiques dans le domaine économique et social. Les 
données obtenues à partir de ces enquêtes servent à l'élaboration 
des indices qui permettent de suivre la conjoncture économique 
du pays. La formule employée pour le calcul des indices au 
Maroc est celle de Laspeyres. 

Une étude approfondie de ces indices, publiés par la 
Direction de la statistique, nous entraînerait dans des détails que 
nous ne pouvons pas développer ici sans alourdir 
considérablement ce chapitre. Mais ceci montre l'importance prise 
par les indices synthétiques dans la vie économique. 

Aucune prévision, aucun plan de développement ne 
saurait se faire sans les prendre en considération. 
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Exercices 



On dispose des informations sur les salaires moyens d'une 
entreprise industrielle secteur par secteur et son nombre de 
salariés : 



Secteurs 


Salaire 


Salaire 


Nombre en 


Nombre en 




moyen en to 


moyen en ti 


to 


ti 


1 


5800 


6000 


250 


241 


2 


6200 


6250 


300 


320 


3 


5920 


6080 


120 


122 


4 


6150 


6300 


45 


43 



L'entreprise désire connaître l'évolution générale de ses salaires 

entre to et ti. 

Calculer les indices de Laspeyres et de Paasche. 

Exercice 2 : 

On donne les prix et les quantités de deux produits A et B dans 

deux villes et 1. 



Produits 


Ville 


Ville 1 


Prix 


Quantités 


Prix 


Quantités 


A 
B 


100 
10 


100 
50 


10 
200 


80 
80 



1) Calculer l'indice de Laspeyres des quantités de la ville 1 
par rapport à la ville 0. D'après cet indice, quelle est la ville 
quia le plus produit? 
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2) Calculer un nouvel indice de Laspeyres, en prenant pour 
base la ville 1. Peut-on conclure de la même manière qu'au 

U? 

3) Calculer les indices de Paasche de bases les villes et 1. 
Que peut-on conclure ? 

Exercice 3 : 

On donne la moyenne des prix de gros et la production de lait, de 
beurre et de fromage dans un pays donné pour les années 1999, 
2000 et 2001. 



Produits 


Prix (par Kilo ou litre) 


Quantités (millions de 
Kilo) 


1999 


2000 


2001 


1999 


2000 


2001 


Lait 

Beurre 

Fromage 


0395 
6,15 
3,48 


0,389 

6,22 

3,54 


0,413 
5,97 
3,89 


9675 
117,7 
77,93 


9717 
115^ 
74,39 


10436 
115,5 

82,79 



1) Calculer un indice global des prix de gros de ces produits 
pour l'année 2001 : 

• En choisissant 1999 comme année de base. 

• En choisissant 1999-2000 comme période de base. 

2) Calculer l'indice de Laspeyres des prix pour l'année 2001 : 

• En choisissant 1999 comme année de base. 
» En choisissant 1999-2000 comme période de base. 

3) Calculer l'indice de Paasche des prix pour l'année 2001 : 

• En choisissant 1999 comme année de base. 



En choisissant 1999-2000 comme période de base. 
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Annexe : 



Interpolation linéaire 



Effectuer une interpolation linéaire entre deux points Ma, f(a)) et 
B(b. f(b» de la courbe représentative C f d'une fonction /, c'est 
supposer qu'entre ces deux points la fonction peut être remplacée 
par une fonction linéaire (qu'il faudra déterminer), afin d'effectuer 
d'éventuelles prévisions des valeurs de/inconnues. 

En statistique, souvent, on a des données qui manquent ou 
aberrantes. Alors, l'interpolation linéaire nous permet de 
retrouver une valeur approchée de telles valeurs. 



Par exemple, soit la situation suivante : 



jgj-i, ei[ 



[3000, 3500f 
(3500, 4000[ 



ni 



15 



20 



On veut avoir la valeur ni qui correspond à la classe [3000, 3200[ 

jc-15 3200 - 3000 
Alors, on a, par interpolation linéaire ^-^ - — _ 3O0Q 



200 _ ,. 
x = XS+15 

500 



A 



= 17 
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Cet ouvrage de 5tatisttque Descriptive s adresse aux 
étudiants de ta première année universitaire, premier et 
deuxième semestres de toutes les filières de la nouvelle 
génération des Licences fondamentales en sciences, 
sciences économiques et gestion... ainsi qu'aux étudiants de 
la première année des écoles dingénieurs et des écoles 
supérieures de commerce et gestion. 

C'est un support de cours et des exercices, présentant 
les notions de-base delà Statistique II dispense, donc, les 
étudiants de prendre des notes de cours, néanmoins, il les 
invite à faire un bon nombre d'exercices, extraits des 
contrôles et des examens, présentés a la fin de chaque 
Chapitre. 
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